2013年,美国机器人公司波士顿动力公司发布了其新型机器人Atlas。这个 6 英尺 2 英寸的人形机器人在 Darpa 机器人挑战赛上亮相,可以在不平坦的地面上行走、跳下箱子,甚至可以爬楼梯。这就像小说中经常描绘的愿景:一个机器人设计得像我们一样操作,能够承担各种日常任务。这似乎是某种事物的黎明。机器人将完成我们所有无聊而艰巨的家务,并担任老年护理人员。
从那时起,我们看到了人工智能 (AI) 从计算机视觉到机器学习的飞跃。最近的大型语言模型和生成式人工智能系统浪潮为人机交互开辟了新的机会。但在研究实验室之外,物理机器人仍然主要局限于工厂和仓库,通常在安全笼后面执行非常具体的任务。家用机器人仅限于吸尘器和割草机,而不完全是机器人罗西。
去年成立的英国政府研发机构高级研究和发明局 (Aria) 机器人项目主任珍妮·里德 (Jenny Read) 表示,自 20 世纪 50 年代以来,机器人身体并未取得实质性发展。我并不是说没有任何进步,但是当你看看计算和软件领域发生的事情时,你会发现进步是如此之少,真是令人震惊。
布里斯托大学机器人和人工智能教授内森·莱波拉 (Nathan Lepora) 表示,开发机器人需要更多资源。拥有计算机的天才可以编写算法,但构建机器人需要访问物理设备。他说,这要慢得多,而且要困难得多。这就是机器人技术落后于人工智能的根本原因。
研究实验室和公司希望弥补这一差距,开发一系列新型人形机器人,其中一些已开始投放市场。波士顿动力公司于四月份退役了原来的液压阿特拉斯车型,并推出了一款新的电动版本,计划在未来几年内将其商业化,并将于明年开始在现代工厂进行测试。总部位于俄勒冈州的 Agility Robotics 声称,其 Digit 机器人是第一个真正获得报酬的人形机器人,负责在物流设施中搬运箱子。埃隆·马斯克坚称,特斯拉的人形机器人(称为 Optimus 或 Tesla Bot)将于明年开始在其汽车工厂工作。
但是,要看到机器人在严格控制的环境之外运行,还有很长的路要走。里德说,人工智能的进步只能让我们在当前的硬件上走得更远,对于许多任务来说,机器人的物理能力至关重要。生成式人工智能系统可以写诗或画画,但它们无法完成我们最希望自动化的肮脏和危险的工作。对于这些,您需要的不仅仅是盒子里的大脑。
有用的机器人设计通常从手开始。里德说,机器人的许多用例实际上依赖于能够精确而熟练地处理事物而不损坏物体。人类在这方面非常擅长。我们可以本能地在举哑铃和处理蛋壳之间切换,或者从切胡萝卜到搅拌酱汁。我们还拥有出色的触觉感知能力,这可以通过我们阅读盲文的能力来证明。相比之下,机器人就很挣扎了。获 5700 万资金支持的 Aria 计划就是针对这个问题。
伦敦 Shadow Robot 总监 Rich Walker 表示,机器人灵活性面临的挑战之一是规模。在卡姆登的公司办公室里,他展示了暗影灵巧手。它的大小与人手一样,有四个手指和一个拇指,关节模仿指关节。虽然手指看起来很精致,但这只手连接着比人类前臂宽得多的机器人手臂,里面装满了电子设备、电缆、执行器和操作这只手所需的所有其他东西。沃克说,这是一个包装问题。
人体尺寸的手的一个优点是其尺寸和形状适合操作人类工具。Walker 举了一个实验室移液器的例子,他用 Sugru(一种可塑粘合剂)对其进行了改进,使其更符合人体工程学。您可以将移液器工具直接连接到机器人手上,但这样它就只能使用移液器,而不能使用剪刀或螺丝刀等。
但是完全像人的手并不适合所有任务。Shadow Robots 最新的手牌 DEX-EE 看起来相当陌生。它有三个手指,更像拇指而不是手指,明显比人类大,并且覆盖有触觉传感器。该公司与 Alphabets 人工智能研究实验室 Google DeepMind 合作设计了它,该实验室想要一只机器人手,能够通过反复尝试(一种称为强化学习的试错方法)来学习如何拾取东西。但这也带来了挑战:机器人手通常被明确设计成不会碰撞到物体,而且一旦碰撞就很容易断裂。DeepMind 研究工程师 Murilo Martins 表示,当他用最初的灵巧手进行实验时,每半小时我就会断裂一根肌腱。
DEX-EE 优先考虑稳健性:视频显示三个数字在被木槌敲击时愉快地打开和关闭。它的尺寸更大,可以容纳更大的滑轮,这对钢丝筋施加的压力更小,这意味着它可以可靠运行至少 300 小时。
即便如此,DeepMind 研究科学家 Maria Bauza 表示,与机器人相处的时间仍然很宝贵。上周,DeepMind 发表了一项研究,概述了一种名为 DemoStart 的新训练方法。这采用了相同的试错方法,但首先使用模拟机器人手而不是真实的机器人手。在训练模拟手完成拧紧螺母和螺栓等任务后,研究人员将这种学习行为转移到真正的 DEX-EE 手上。鲍扎说,这双手仍然经过了成千上万次实验。只是我们不让他们从头开始。
这减少了运行实验的时间和成本,从而更容易训练能够适应不同任务的机器人。然而,这些技能并不总是能完美地转移。虽然 DeepMinds 模拟机械手能够在 99.6% 的时间内将插头插入插座,但真实的机械手只能做到 64% 的成功率。
这项工作是人工智能和机器人身体如何齐头并进发展的一个例子。只有通过物理交互,机器人才能真正理解其环境。毕竟,Read 指出,ChatGPT 等文本生成器背后的大型语言模型是在互联网上共享的庞大人类语言语料库上进行训练的,但是我从哪里获得有关摘草莓或制作草莓的感觉的数据?三明治?
正如 DeepMind 机器人团队所写:大型语言模型可以告诉你如何拧紧螺栓或系鞋带,但即使它体现在机器人中,它本身也无法执行这些任务。
马丁斯更进一步。他认为机器人技术对于实现通用人工智能(AGI)至关重要,这是许多人工智能研究人员梦想的广泛的、与人类相当的智能。他认为人工智能只有具有物理形式才能真正理解我们的世界。他说,对我来说,如果没有具体化身,通用人工智能就不存在,就像如果没有我们自己的身体,人类智能就不存在一样。
手虽然重要,但只是身体的一部分。虽然 Shadow Robot 和其他公司专注于手指,但越来越多的公司和实验室正在开发完整的人形机器人。
类人生物的吸引力部分可能是心理上的。Walker 说,它是我们都期待的机器人,就像 C3PO 一样。但使用人体作为缪斯也是有逻辑的。Agility Robotics 联合创始人兼首席机器人官 Jonathan Hurst 表示,我们所有的环境都是围绕人来设计的。因此,拥有大致人性化的外形是能够移动、操纵并与人共存的一种非常好的方式。
但是人形机器人可能并不是适合所有工作的最佳设计。轮式机器人可以去轮椅使用者可以去的任何地方,当涉及到更棘手的地形时,四条腿可能比两条腿更好。波士顿动力公司的像狗一样的 Spot 可以在崎岖的地面或楼梯上奔跑,如果它摔倒了两足机器人难以克服的东西,它还能自行恢复原状。波士顿动力公司发言人在电子邮件中补充道,仅仅因为人形机器人与人类具有相似的形状,并不意味着它需要以这种方式移动并受到我们关节的限制。
目前,类人生物仍在寻找自己的立足点。布里斯托大学的莱波拉表示,华丽的视频和时尚的设计可能会让人们对自己的能力或可靠性产生不切实际的感觉。波士顿动力公司的视频令人印象深刻,但该公司还以其显示其机器人故障的花絮而闻名。一月份,马斯克分享了一段擎天柱折叠衬衫的视频,但敏锐的观众发现了机器人正在被远程操作的明显迹象。
将机器人带出实验室和工业环境并进入家庭或公共场所的一个主要挑战是安全性。6 月,电气和电子工程师协会 (IEEE) 成立了一个研究小组,专门探索人形机器人的标准。该组织主席亚伦·普拉瑟 (Aaron Prather) 解释说,共享空间中的人形机器人与装在保护笼中的工业机器人是不同的主张。他说,对他们来说,与亚马逊工厂或福特工厂的同事互动是一回事,因为那是一位训练有素的工人正在与机器人一起工作。[但是如果]我把那个机器人放在公园里,它会如何与孩子们互动?它如何与不了解正在发生的事情的人互动?
赫斯特设想下一步将机器人应用于零售业,为货架上货或在后台工作。普拉瑟相信我们很快就会看到机器人服务员。然而,对于许多应用来说,使用机器人可能没有经济意义。沃克举了送货机器人的例子。他说,与签订最低工资、零工时合同的电动滑板车相比,它必须具有成本效益。
我采访过的大多数机器人专家都表示,能够洗碗、洗衣服和遛狗的多功能家用机器人还很遥远。波士顿动力公司表示,有用的类人机器人时代已经到来,但通往真正通用类人机器人的道路将是漫长而艰难的,而且还需要很多年。里德说,护理机器人经常被宣传为人口老龄化的解决方案,但前景将特别艰难。她说,让我们先让机器人能够可靠地拆卸笔记本电脑或为你制作三明治,然后再考虑它如何照顾老年人。如果我们甚至希望机器人承担护理工作的话。就像艺术和诗歌一样,也许有些角色还是最有人情味的。