加入我们的每日和每周时事通讯,了解有关行业领先人工智能报道的最新更新和独家内容。了解更多
人工智能开发公司 SingularityNET 和人工超级智能联盟(ASI 联盟)表示,随着人工智能通过实践来学习如何玩游戏,新的学习人工智能已在《我的世界》实例中留给了自己的设备。该人工智能名为 AIRIS(自主智能强化推断象征主义),本质上是从《我的世界》中的任何东西开始学习如何玩游戏,只使用游戏的反馈循环来教授它。
人工智能以前曾被允许学习游戏,但通常是在更线性的 2D 空间中。借助《我的世界》,AIRIS 可以进入一个更复杂的 3D 世界,并慢慢开始导航和探索,看看它能做什么,更重要的是,人工智能是否能够理解游戏设计目标,而无需被告知。它对环境的变化有何反应?它能找出通往同一个地方的不同路径吗?它能像人类玩家在《我的世界》中那样发挥创造力来玩游戏吗?
VentureBeat 联系了 SingularityNET 和 ASI Alliance,询问他们为什么专门选择 Minecraft。
“AIRIS 的早期版本是在简单的 2D 网格世界益智游戏环境中进行测试的,”该公司的一位代表回答道。– 我们需要在更复杂和开放的 3D 环境中测试系统。《我的世界》非常符合这个描述,是一款非常受欢迎的游戏,并且具备将人工智能插入其中所需的所有技术要求。《我的世界》也已被用作强化学习基准。这将使我们能够直接将 AIRIS 的结果与现有算法进行比较。”
他们还对其工作原理进行了更深入的解释。
– 代理从环境中获得两种类型的输入以及它可以执行的操作列表。第一种类型的输入是围绕代理的块名称的 5 x 5 x 5 3D 网格。这就是代理“看待”世界的方式。第二种类型的输入是智能体在世界中的当前坐标。这使我们可以选择为代理提供我们希望其到达的位置。第一个版本中的动作列表是沿 8 个方向(四个基本方向和对角线)移动或跳跃,总共 16 个动作。随着我们扩展代理的能力,包括采矿、放置方块、收集资源、对抗怪物和制作,未来的版本将有更多的动作。
– 代理以“自由漫游”模式开始,并寻求探索周围的世界。构建可以使用随附的可视化工具查看的内部地图。它学习如何驾驭世界,当它遇到树木、山脉、洞穴等障碍时,它会学习并适应它们。例如,如果它掉进一个很深的山洞里,它就会探索出路。它的目标是填充其内部地图中的任何空白区域。因此,它寻找方法到达它尚未到达的地方。
– 如果我们给代理一组坐标,它将停止自由探索并导航到我们想要它去的任何地方。探索从未见过的领域。那可能是在山顶,在洞穴深处,或者在海洋中央。一旦它到达目的地,我们就可以给它另一组坐标,或者让它自由漫游,从那里开始探索。
– 自由探索和穿越未知领域的能力是 AIRIS 与传统强化学习的不同之处。这些任务是强化学习无法完成的,无论有多少个训练集或多少计算量。 –
对于游戏开发,AIRIS 的成功用例可能包括软件的自动错误和压力测试。例如,假设的 AIRIS 可以运行整个《辐射 4》,它可以在与 NPC 或敌人交互时创建错误报告。虽然质量保证测试人员仍然需要检查人工智能记录的内容,但这将加快费力且令人沮丧的开发过程。
此外,这是在复杂、全方位的世界中人工智能自主学习的虚拟世界的第一步。这对于整个人工智能爱好者来说应该是令人兴奋的。