加入我们的每日和每周时事通讯,了解有关行业领先人工智能报道的最新更新和独家内容。了解更多
人形机器人不再是科幻小说中的东西。想象一下这样一个世界:机器人不仅在工厂里与我们合作,而且还在商店里迎接我们、帮助手术并照顾我们所爱的人。特斯拉计划部署数千辆2026 年 Optimus 机器人,人形机器人的时代比我们想象的更近。
随着越来越多的公司展示突破性创新,这一愿景变得越来越具体。2025 年消费电子展 (CES) 展示了机器人技术如何在功能和以人为本的设计方面取得进步的几个例子。这些包括ADAM 机器人调酒师来自 Richtech Robotics,该公司将 50 多种饮料混合并与顾客互动,以及Tombot Inc. 的小狗它们摇尾巴并发出声音,旨在安慰患有痴呆症的老年人。虽然展会上展示的这些机器人和其他机器人可能有市场,但广泛部署此类机器人技术仍处于早期阶段。
尽管如此,该领域正在取得真正的技术进步。这越来越多地包括使用“人形”机器人生成式人工智能创造更多类似人类的能力 – 使机器人能够学习,在复杂环境中感知并采取行动。从 Tesla 的 Optimus 到 Aria瑞尔博蒂克斯,未来十年将看到人形机器人的激增。
尽管取得了这些有希望的进步,但一些专家警告说,实现完全类人的能力仍然是一个遥远的目标。“人工智能教父”之一 Yann LeCun 引用了当前技术的缺陷 -最近争论人工智能系统不“有能力计划、推理……或理解物理世界。”他补充说,我们今天无法建造足够聪明的机器人,因为“我们无法让它们成为足够聪明。 –
LeCun 可能是正确的,但这并不意味着我们不会很快看到更多的人形机器人。埃隆·马斯克最近表示,特斯拉将生产数千个 Optimus 单位预计在 2025 年发货50,000 至 100,000到 2026 年,它们的数量将大幅增加。与目前执行有限功能的少数几个相比,这是一个巨大的增长。当然,众所周知,马斯克的时间表是错误的,比如什么时候他在2016年说完全自动驾驶将在两年内实现。
尽管如此,很明显,人形机器人正在取得重大进展。特斯拉并不是唯一一家追求这一目标的公司,Agility Robotics、Boston Dynamics 和 Figure AI 等其他公司都是人形机器人领域的领导者。
商业内幕最近进行了交谈Agility Robotics 首席执行官佩吉·约翰逊 (Peggy Johnson) 表示,人形机器人在各种工作场所成为人类的同事很快就会“非常正常”。上个月,Figure 在一份声明中宣布领英帖子:“我们向商业客户交付了 F.02 人形机器人,他们目前正在努力工作。”在微软和 Nvidia 等主要投资者的大力支持下,Figure 将为人形机器人市场带来激烈的竞争。
创造世界观
然而,LeCun 确实有道理,因为机器人需要更先进的技术才能拥有更完整的人类能力。在工厂中移动零件比在动态、复杂的环境中移动要简单。
当前一代机器人面临三个关键挑战:足够快地处理视觉信息以实时做出反应;了解人类行为的微妙线索;并适应环境中的意外变化。如今,大多数人形机器人都依赖于云计算,由此产生的网络延迟可能会使拾取物体等简单任务变得困难。
初创公司 World Labs 是一家致力于克服当前机器人技术局限性的公司,该公司由“人工智能教母”李飞飞创立。与交谈有线李说:“计算机的物理世界是通过摄像机看到的,而摄像机背后的计算机大脑。将这种愿景转化为推理、生成和最终的交互需要理解物理结构、物理世界的物理动力学。这项技术被称为空间智能。 –
Gen AI 通过帮助机器人像人类一样实时绘制周围环境,预测物体如何移动或变化,从而增强空间智能。这些进步对于创建能够在复杂的现实世界场景中导航并具有成功所需的适应性和决策技能的自主人形机器人至关重要。
虽然空间智能依赖实时数据来构建环境的心理地图,但另一种方法是帮助人形机器人从单个静态图像推断现实世界。正如中所解释的预发表论文,Generative World Explorer (GenEx) 使用 AI 从单个图像创建详细的虚拟世界,模仿人类如何推断周围环境。虽然仍处于研究阶段,但该功能将帮助机器人做出瞬间决策或利用有限的传感器数据导航新环境。这将使他们能够快速理解和适应他们以前从未经历过的空间。
机器人技术的 ChatGPT 时刻即将到来
虽然 World Labs 和 GenEx 突破了人工智能推理的界限,但 Nvidia 的 Cosmos 和 GR00T 正在解决为人形机器人配备现实世界适应性和交互能力的挑战。宇宙是一系列 AI“世界基础模型”,可帮助机器人理解物理和空间关系,而 GR00T(通用机器人 00 技术)允许机器人通过观察人类来学习,就像学徒向师傅学习一样。这些技术共同帮助机器人了解该做什么以及如何自然地做到这一点。
这些创新反映了机器人行业更广泛地推动人形机器人具备认知和身体适应性。GR00T 可以使人形机器人通过观察和模仿医疗专业人员来帮助医疗保健,而 GenEx 可以使机器人通过从有限的视觉输入推断环境来导航灾区。据报道投资者商业日报Nvidia 首席执行官黄仁勋表示:“机器人技术的 ChatGPT 时刻即将到来。”
另一家致力于创建物理人工智能模型的公司是谷歌 DeepMind。蒂莫西·布鲁克斯 (Timothy Brooks) 是那里的一名研究科学家,发布本月 X 上有关该公司计划制作模拟物理世界的大型生成模型的消息。
这些新兴的物理世界模型将更好地预测、规划和从经验中学习,这些都是未来人形机器人的基本能力。
机器人来了
2025 年初,人形机器人大部分仍处于原型阶段。短期内,他们将专注于特定任务,例如制造、物流和灾难响应,自动化在这些任务中提供直接价值。随着技术的成熟,护理或零售互动等更广泛的应用将在稍后出现。然而,人工智能和机械工程的进步正在加速此类人形机器人的发展。
咨询公司埃森哲最近注意到正在开发全套机器人硬件、软件和人工智能模型,这些模型专门用于在人类世界中创建机器自治。在他们的——2025年技术愿景– 在报告中,该公司表示:“在未来十年中,我们将开始看到机器人随意、普遍地与人类互动,推理完成计划外的任务,并在任何环境下独立采取行动。”
摩根士丹利估计预计到 2040 年,美国人形机器人的数量将达到 800 万台,到 2050 年将达到 6300 万台。该公司表示,除了技术进步之外,长期人口变化造成的劳动力短缺可能有助于推动机器人的发展和采用。打造值得信赖的机器人
除了纯粹的技术障碍之外,还必须克服潜在的社会反对意见。
如果不解决这些问题,公众的怀疑可能会阻碍人形机器人的采用,即使是在它们提供明显好处的领域。为了取得成功,部署的人形机器人需要被视为值得信赖,并且人们需要相信它们有助于社会。作为著名的经过麻省理工科技评论,“如果这样的机器人现在走进他们的客厅,很少有人会感到温暖和舒适。”
为了解决信任方面的挑战,研究人员正在探索如何让机器人显得更具亲和力。例如,日本的工程师用人类皮肤细胞制造了一种面罩,并将其贴在机器人上。根据去年夏天发表的一项研究报道经过纽约时报该研究的首席研究员表示:“类人的面孔和表情改善了人机交互中的沟通和同理心,使机器人在医疗保健、服务和陪伴方面更加有效。”换句话说,人类类似的外观会提高信任度。
除了显得值得信赖之外,类人机器人还需要始终如一地表现出道德和负责任的行为,以确保人类的接受。例如,在公共场所,带有摄像头的人形机器人可能会无意中收集敏感数据,例如对话或面部细节,引发对监视的担忧。确保透明数据实践的政策对于减轻这些风险至关重要。
下一个十年
在短期内,人形机器人将专注于特定任务,例如制造、物流和灾难响应,自动化在这些任务中提供直接价值。这些专业角色凸显了他们当前在结构化环境中的优势,而随着技术的成熟,医疗保健、护理和零售业务等更广泛的应用将会出现。
随着人形机器人在日常生活中变得越来越明显,它们的存在将深刻影响并可能重塑人类互动和社会规范。除了执行任务之外,这些机器还将融入社会结构,要求人类与技术建立新的关系。它们的采用可以缓解老龄化社会的劳动力短缺问题,提高服务业的效率,但也可能在日益自动化的世界中引发有关工作岗位流失、隐私和人类身份的争论。为这些转变做好准备不仅需要技术进步,还需要深思熟虑的社会适应。
通过应对挑战并利用人形机器人的效率和适应性,我们可以确保这些技术成为进步的工具。塑造这个未来不仅是政策制定者和技术领导者的责任,也是每个人的共同话题。公众参与对于确保人形机器人改善社会并满足人类的实际需求至关重要。
加里·格罗斯曼 (Gary Grossman) 是以下公司的技术实践执行副总裁爱德曼爱德曼人工智能卓越中心的全球领导者。
数据决策者
欢迎来到 VentureBeat 社区!
DataDecisionMakers 是专家(包括从事数据工作的技术人员)可以分享与数据相关的见解和创新的地方。
如果您想了解前沿思想和最新信息、最佳实践以及数据和数据技术的未来,请加入我们的 DataDecisionMakers。
你甚至可以考虑 贡献一篇文章属于你自己的!