英语轻松读发新版了,欢迎下载、更新

这是人工智能机器人未来的一瞥

2024-10-31 17:05:59 英文原文

作者:Will Knight

机器人可以做各种各样的家务活,从从烘干机中取出物品到折叠衣物,再到清理凌乱的桌子,长期以来,这个想法似乎纯粹是科幻小说——也许最著名的体现是 20 世纪 60 年代的幻想罗西在杰森一家

身体智力旧金山的一家初创公司已经证明,这样的梦想实际上可能并不遥远,展示了一个单一的人工智能该模型通过接受前所未有的数据量训练,学会了做各种有用的家务(包括上述所有内容)。

由物理智力提供

这一壮举提高了带来像其他人工智能模型一样神奇和普遍能力的东西的前景聊天GPT进入物理世界。

的出现大语言模型 (LLM)——通用学习算法从书籍和互联网中获取大量文本——赋予了聊天机器人更通用的功能。物理智能的目标是通过使用大量机器人数据训练类似的算法,在物理世界中创造出具有类似功能的东西。

“我们有一个非常通用的方法,可以利用来自许多不同实施例、许多不同机器人类型的数据,这与人们训练语言模型的方式类似,”该公司首席执行官表示,卡罗尔·豪斯曼

由物理智力提供

该公司在过去八个月里一直在开发其“基础模型”,称为Ï0 或 pi-0。Ï0 使用来自几种类型的机器人(做各种家务)的大量数据进行训练。该公司经常让人远程操作机器人以提供必要的教学。

物理智能(Physical Intelligence),也称为 PI 或 Ï,于今年早些时候由几位著名的机器人研究人员创立,旨在追求受人工智能语言能力突破启发的新机器人方法。

“据我们所知,我们训练的数据量比以往任何机器人模型都要多,而且差距非常大。”说谢尔盖·莱文物理智能联合创始人,加州大学伯克利分校副教授。“无论如何,它都不是 ChatGPT,但也许它接近 GPT-1,”他在提到OpenAI 开发的第一个大型语言模型2018年。

Physical Intelligence 发布的视频显示,各种机器人模型以令人印象深刻的技能完成一系列家务活。轮式机器人把手伸进烘干机取衣服。机器人手臂清理着摆满杯子和盘子的桌子。一对机械臂抓取并折叠衣物。该公司算法掌握的另一项令人印象深刻的壮举是建造一个纸板箱,其中需要一个机器人轻轻弯曲其侧面并将各个部件巧妙地组装在一起。

由物理智力提供

豪斯曼说,折叠衣服对于机器人来说尤其具有挑战性,需要更多关于物理世界的一般智能,因为它涉及处理各种会不可预测地变形和皱折的柔性物品。

该算法表现出一些令人惊讶的类似人类的怪癖,例如摇晃 T 恤和短裤,让它们平放。

豪斯曼指出,该算法并不完美,就像现代聊天机器人一样,机器人有时会以令人惊讶和有趣的方式失败。当被要求将鸡蛋装入纸箱时,机器人曾经选择将盒子装得过满并强制其关闭。还有一次,一个机器人突然从桌子上扔下了一个盒子,而不是往里面装东西。

建造更通用的机器人不仅是科幻小说中的比喻,当然也是一个巨大的商业机会。

由物理智力提供

尽管近年来人工智能取得了惊人的进步,但机器人仍然顽固地愚蠢和有限。在工厂和仓库中发现的那些通常会经历精确设计的例程,没有太多感知周围环境或即时适应的能力。为数不多的工业机器人可以看到并抓住物体由于缺乏一般的身体智力,只能以最低限度的灵活性做有限的事情。

能力更通用的机器人可能可以承担更广泛的工业任务,也许在进行最少的演示之后。机器人还需要更通用的能力,以应对人类家庭的巨大变化和混乱。

人们对人工智能进步的普遍兴奋已经转化为对机器人技术重大新飞跃的乐观情绪。埃隆·马斯克的汽车公司特斯拉正在开发一种名为擎天柱的人形机器人,马斯克最近建议的到 2040 年,它将以 20,000 至 25,000 美元的价格广泛使用,并且能够完成大多数任务。

由物理智力提供

以前教机器人完成具有挑战性的任务的努力主要集中在训练一台机器执行一项任务,因为学习似乎是不可转移的。最近的一些学术工作表明,通过足够的规模和微调,学习可以在不同的任务和机器人之间转移。2023 年 Google 项目名为开放X实施例涉及在 21 个不同研究实验室的 22 个不同机器人之间共享机器人学习。

物理智能所追求的战略的一个关键挑战是,可用于训练的机器人数据规模与文本形式的大型语言模型不同。因此,公司必须生成自己的数据,并提出改进从更有限的数据集中学习的技术。为了开发 Ï0,该公司将所谓的视觉语言模型(该模型经过图像和文本训练)与扩散建模(一种借用人工智能图像生成的技术)相结合,以实现更通用的学习。

为了让机器人能够承担人类要求它们做的任何机器人杂务,这种学习需要大幅扩大。“还有很长的路要走,但我们有一些你可以认为是脚手架的东西,可以说明未来的事情,”莱文说。

关于《这是人工智能机器人未来的一瞥》的评论


暂无评论

发表评论

摘要

旧金山初创公司 Physical Intelligence 开发了一种名为 π0 的人工智能模型,可以使用大量的机器人数据来执行各种家务活。这一成就让科幻小说中的多功能家用机器人的概念更加接近现实。该公司的目标是通过在大量机器人数据上训练算法来创建具有与大型语言模型类似的通用功能的机器人。视频显示,机器人以令人印象深刻的技能执行诸如卸载烘干机、清理桌子和折叠衣物等任务,尽管它们偶尔会表现出类似人类的怪癖和错误。尽管在扩大这种学习方法方面存在挑战,但这一发展被视为朝着更广泛的工业和家用机器人迈出的重要一步。