输入法|为什么人工智能在Dota中击败了所有人,但在现实世界中却无法生存( 二 )



机器中复杂技能的发展仍然比人在人中慢 。 所以 , 如果你计算人工智能学习如何玩DOTA所花费的时间 , 你会需要45000年 。 但是 , 由于该过程发生在虚拟环境中 , 因此可以加速和并行化 , 并将数千年压缩为一年 , 怎么感觉像开挂了 。 例如 , OpenAI机器人花了十个月的培训 。 在国际Dota 2锦标赛中 , 击败世界冠军 。 该公司还设法创建了机器人(或者更确切地说是一个机械臂) , 能够组装魔方 。 为此 , AI在虚拟环境中花费了10000年的模拟时间 , 不断进行训练 。
在游戏中 , 计算机很容易胜过最有天赋的人类 , 但对于应用来说 , 这还不够 。 现实世界要比虚拟世界复杂得多 , 有许多难以预测的事件 。 科学家们正在努力使RL算法的实现更加接近 , 但这是一个漫长而昂贵的过程 。 一般来说 , 在科学领域 , 对社会的效用并不总是立即形成的:发现往往需要一个科学基础来准备 。 基础设施的支持对于这种基础研究非常重要 。
来自人类的大师课:人工智能如何在现实世界中生存你可以想象到强化学习在现实世界中的几个成功应用 。 例如 , 谷歌已经创建了基于RL的深度学习算法PRIME 。 它有助于开发快速和紧凑的处理器来处理人工智能任务 。 人工智能制造的芯片具有高达50%的延迟 , 生产时间从几个月缩短到六个小时 。 此外 , 芯片本身也缩小了1.5倍 , 使其生产成本更低 , 并减少了功耗 。

步行机器人是实施强化学习的另一个例子 。 他们扫描周围的世界 , 在一个处理器中创建他们周围环境的模型 , 并学习在这个 \"虚拟现实 \"中采取行动 。 他们学到的技能随后被用于在现实世界中导航 。 这样的机器人已经可以在硬地和软地上跑 , 爬楼梯 , 甚至在湿滑的表面上保持平衡 。
一旦我们了解了如何利用这种方法工作 , 我们就可以优化所有的流程 。 如果我们把目光投向未来几十年 , 也许RL的实验将导致科学家能够创造某种人类以外的实体 。 从哲学和心理学的角度来看 , 这将是很有趣的 。 人类是一个试图了解自己的封闭系统 , 因为在宇宙的范围内 , 我们暂时是孤独的 。 未来某物(或某人)的出现 , 不受我们意识和生理的限制 , 将帮助人们审视自己的生活 , 找到新的意义 , 并得到许多问题的答案 。

相关经验推荐