谷歌母公司 Alphabet 旗下的无人驾驶乘车部门 Waymo 现在为其自动驾驶业务推出了新的人工智能研究模型。
在其发布的两份新闻稿中人工智能方法及其新的自动驾驶端到端多模式模型,称为艾玛,Waymo 分享了有关其人工智能研究模型未来计划的详细信息。该公司表示,它仍在研究阶段使用 EMMA 模型,而不是在运营车辆中,该方法作为一种替代方案,看起来很像特斯拉的全自动驾驶 (FSD) 和其他端到端模型方法。
“EMMA 是一项研究,展示了自动驾驶多模式模型的力量和相关性,”Waymo 副总裁兼研究主管 Drago Anguelov 说道。– 我们很高兴继续探索多模式方法和组件如何有助于构建更具通用性和适应性的驾驶堆栈。 –
Waymo 表示,EMMA 模型使用基于其 Gemini 语言模型的现实世界知识,而端到端方法预计最终将让自动驾驶汽车直接根据传感器数据和实时驾驶场景进行操作。该公司还强调了其对大型语言模型 (LLM) 和视觉语言模型 (VLM) 的使用,并将其架构称为 Waymo 基金会模型。
下面请听该公司高管详细介绍 Waymo 研究和人工智能计划。
EMMA 研究和批评
在有关 EMMA 的公告新闻稿中,Waymo 列出了该研究计划的以下关键方面:
- 端到端学习:EMMA 处理原始摄像头输入和文本数据,以生成各种驾驶输出,包括规划轨迹、感知对象和道路图元素。
- 统一语言空间:EMMA 通过将非传感器输入和输出表示为自然语言文本,最大化 Gemini 的世界知识。
- 思维链推理:EMMA 使用思想链推理来增强其决策过程,将端到端规划性能提高 6.7%,并为其驱动决策提供可解释的理由。
“我们试图解决的问题是如何构建在现实世界中导航的自主代理,”Waymo 工程副总裁 Srikanth Thirumalai 说道。“这远远超出了许多人工智能公司正在尝试做的事情。”
尽管如此,一些人对大规模端到端模型表示怀疑,称在不采取重大保障措施的情况下利用生成式人工智能模型可能风险太大。
Aurora Innovation 首席产品官斯特林·安德森 (Sterling Anderson) 在一份声明中表示,“它正在追随一些听起来令人印象深刻的东西,但并不是解决方案。”汽车新闻。
Mobileye 首席技术官 Shai Shalev-Shwartz 称端到端方法存在巨大风险,尤其是在验证模型上运行的车辆的决策过程方面。还值得注意的是,Waymo 目前只是在研究这种方法,目前没有任何将其商业化的计划。
消息传来后Waymo 最近完成了 56 亿美元的融资,有效地带来了公司估值突破 450 亿美元。该公司还在乔治亚州的一家新工厂生产基于现代 Ioniq 5 的下一代自动驾驶汽车。
你有什么想法?让我知道zach@teslarati.com,在 X 上找到我,地址为@zacharyvisconti,或向我们发送提示Tips@teslarati.com。您的 Tesla 需要配件吗?
查看特斯拉拉蒂市场:
Waymo 推出自动驾驶操作人工智能研究模型