独家：Waymo工程高管讨论将驱动汽车进入新城市的自动驾驶AI模型

2024-10-18 16:51:00 英文原文

作者：Sharon Goldman

当我发布时Instagram在五月，当我第一次在旧金山乘坐自动驾驶的Waymo汽车（这是一段视频，展示了一个空无一人的驾驶座，在繁忙街道上方向盘平稳地向左转动）时，人们的反应从“天啊”和“这太疯狂了”到“不不不”。

我得承认，当Waymo（一辆引人注目的白色全电动汽车，车顶装有旋转传感器）载着我在旧金山一条最陡峭的街道上来回行驶时，我自己也感到有些紧张。但当我看到自动驾驶系统在沿途每一个停车标志前都完全而温柔地停下时，我感到非常惊喜（并松了一口气）。Waymo是一个防御性驾驶者，但并不是太慢；它谨慎地操控方向盘，但在进入车流时却表现出坚定的决心。最后，我终于放松下来，长舒一口气。

Waymo的礼貌司机似乎几乎像是魔法。这次乘车让我不禁思考：我的Waymo究竟是如何做到不发生事故的？最近，随着Waymo准备扩展到亚特兰大和奥斯汀，并扩大其在旧金山湾区、洛杉矶和凤凰城的车队规模，它给了我一个机会去找到答案。

Waymo， Alphabet公司的一个子公司，最初是从谷歌2009年的自动驾驶项目直到近几年才开始向公众提供没有人类安全驾驶员的乘车服务。八月份它宣布已经为超过每周10万单付费乘车次数但在它运营的几个美国城市中。但随着Waymo扩展到新的城市，它需要说服成千上万的新乘客克服乘坐无人驾驶出租车时那种不安的感觉。

虽然Waymo在过去对其人工智能驱动的自动驾驶技术的具体工作原理持谨慎态度，但现在该公司认为提供更深入的了解对于使自主驾驶汽车获得更广泛的认可是重要的。Waymo负责车载技术工程的负责人Srikanth Thirumalai表示财富优先强调安全而非人工智能在信息传递中的重要性，对于建立潜在乘客的信任至关重要。（当然，所有自动驾驶汽车公司也必须应对监管审查。）

“我们不想把注意力从实际上我们要做的事情上转移开，”Thirumalai说。财富杂志在他去年加入Waymo（此前在该公司工作了18年后离开过一段时间）以来的第一次采访中亚马逊“我们必须带头说‘嘿，我们在负责任地开发这项技术。’”

但他解释说，帮助更多的人理解其人工智能系统的运作方式是该公司15年努力构建“世界上最值得信赖的驾驶员”的下一阶段。

“分享更多关于我们技术及其安全性的信息，对于建立与我们在其中运营的骑手和社区之间的信任至关重要，”他说。

Waymo的扩张计划取决于人们是否对空无一人的驾驶座感到舒适。

JASON HENRY/AFP via Getty Images

超越生成式AI的炒作

虽然Waymo拥有在自动驾驶竞赛中领先目前，自动驾驶汽车仍然是一项正在进行中的工作。来自通用汽车的竞争对手，亚马逊，和特斯拉对于像Wayve这样的软件开发人员来说，都是投入数十亿美元转向开发自己的系统。监管机构密切监控当前在指定区域行驶的自动驾驶汽车。

二月通用汽车的Cruise公司的自动驾驶测试许可证被加州车辆管理局撤销了去年，该公司的一辆在旧金山的自动驾驶出租车发生了一起事故，撞上了一个被另一辆车撞飞到其行驶路径上的行人，并拖行受伤女子20英尺。事故发生后，该公司将其在美国的所有车队停运，并且最近才开始在一些城市重新进行测试，测试时配有安全驾驶员。

Waymo至今尚未发生严重事故，但已经发生了其新闻份额今年5月，在亚利桑那州菲尼克斯市，一辆无人驾驶的Waymo出租车撞上了一根电话杆，导致Waymo发布了公告。自愿召回并更新其全部672辆自动驾驶汽车的软件。8月，有报道称Waymo的车辆在旧金山的一个停车场互相鸣笛，打扰了邻居（Waymo表示这是为了防止倒车时低速碰撞的安全功能的“意外后果”）。而上周，在Y Combinator活动外的一辆San Francisco公交车旁边，一辆Waymo汽车停了下来，一段视频因此走红。几位科技公司的首席执行官试图推动它往前发展（Waymo的代表表示，“公共汽车的后门与我们的车辆侧面接触，无法关闭。我们派遣了路边援助团队来拖走车辆，在他们到达之前，旁观者摇晃了一下我们的车辆使其脱离了卡住的状态，这样巴士就可以继续前进了。”）

Thirumalai，他在加入Waymo之前专注于亚马逊的AI驱动搜索和购物业务，强调了他对开发能够在现实世界中安全可靠运行的产品所面临的挑战感到兴奋。事实上，这是他加入Waymo的原因之一。同时，他还表示，这是一种超越当前围绕生成式人工智能炒作的方式，令人谦卑。

他解释说，自动驾驶汽车呈现一个极端的“长尾”学习问题——即罕见且难以预料的事件虽然单个发生概率低，但总体上数量众多，并且亟需解决。这些车辆需要一种能够“很好地泛化”的人工智能，以便既能处理相对常见和可预测的情况（如在红灯时停车或礼让行人），也能应对一些令人惊讶或不寻常的情形，例如夜间轮椅使用者过马路或者树木突然倒在路上。或者一卡车马戏团动物从卡车后面逃走了（好吧，最后一个是我编的，但这就是重点——AI需要准备好应对任何情况）。

Waymo的双AI模型——车载和云端

为了应对可预测的和“长尾”驾驶情况，Waymo目前汽车中的技术堆栈——以及仍在测试中尚未提供给乘客的下一代版本——从几十个车载传感器开始，这些传感器允许车辆可视化其环境，并为AI系统提供全面的数据以帮助其实时决策。

这些传感器包括雷达、高清和其他视频摄像头，以及外部音频接收器等。车顶激光雷达（激光探测和测距）传感器能够生成实时的、全方位的三维视图，并提供深度感知。这一系列传感器为Waymo Driver系统提供了重叠的视野，使其可以从不同角度同时观察到远至300米范围内的物体、障碍物或地形特征（据Waymo称，下一代系统的探测距离在晴朗天气下可达500米）。

传感器从各种场景中收集数据，这些数据来自于Waymo每次出行时的收集。该公司还使用合成数据来训练Waymo，通过模拟比在凤凰城或旧金山道路上可能遇到的更广泛多样的情况（如天气条件）进行训练。

Waymo 使用一系列传感器和人工智能来感知周围的世界

Mario Tama/ Getty Images

Waymo开发了一个名为Waymo基础模型的大规模人工智能模型，该模型支持车辆感知周围环境的能力、预测道路上其他人的行为、模拟场景并做出驾驶决策。这个庞大的模型类似于像ChatGPT这样的大规模语言模型（LLMs），这些模型通过在海量数据集上训练来学习模式和进行预测。就像公司如OpenAI和谷歌构建了新的多模态模型为了结合不同类型的数据（如文本、图像、音频或视频），Waymo的AI整合了多个来源的传感器数据以理解其环境。

Waymo基金会模型是一个庞大单一的模型，但当乘客上车时，汽车使用的是一个较小的车载模型，这个小模型是从那个更大的模型中“提炼”出来的——因为它需要足够小巧以便在汽车的计算能力范围内运行。大的模型被用作“教师”模型，向更小的“学生”模型传授知识和能力——这是生成式AI领域广泛采用的一种方法。这些小型模型经过优化以实现速度和效率，并且能够在每辆车的实时操作中运行——同时仍保留了驾驶汽车所需的关键决策能力。

因此，感知和行为任务，包括识别物体、预测其他道路使用者的行为以及规划车辆的下一步动作，在汽车上实时进行。更大的模型还可以模拟逼真的驾驶环境，以虚拟方式测试和验证其决策，然后再部署到Waymo车辆中。车载模型还意味着Waymo不需要持续的无线互联网连接来运行——如果连接暂时中断，Waymo不会停止不动。

最终，Thirumalai解释说，Waymo的AI系统能够在给定的情况下选择它认为的最佳轨迹。（Waymo没有分享关于模型的具体规格，如参数数量或其他细节，理由是保密。）

“我看到了未来，不参与其中才是愚蠢的”

Waymo的AI系统并不是公司用来解决自动驾驶问题的唯一方法。例如，一家由英国初创企业Wayve开发的方法也获得了支持。微软而Meta的研究负责人扬·勒丘恩并不使用LiDAR（尽管它使用高清晰度摄像头），而是依赖于许多车辆中已经标配的摄像头和超声波传感器，并且该系统主要专注于开发一个单一的生成式AI“世界模型”，这个模型可以解释视觉数据并作为一个集成系统做出驾驶决策。特斯拉的自动辅助驾驶系统目前还无法实现完全自主驾驶，它不使用LiDAR，而是依赖于一系列八个提供车辆周围360度视角的传感器和摄像头。随着汽车制造商趋向于无监督的自动驾驶它已经开始测试一个新的基于神经网络的人工智能系统。

然而，Wayve 并不像 Waymo 那样在公路上有数百辆自动驾驶机器人出租车——相反，它正在开发其软件产品，以部署在主要汽车制造商建造的车辆中。据报道，特斯拉的 Robotaxi 至少还需要一两年的时间才能上路。而 Waymo 的方法则“从我们试图解决的问题出发，即如何让这些车真正进入现实世界？”

Waymo的自动驾驶汽车在旧金山的街头随处可见。

贾斯汀·萨利文/盖蒂图片社

对于Thirumalai来说，帮助Waymo利用AI达到其安全目标的机会是千载难逢的，他无法拒绝。“我在亚马逊工作得很开心，并不真的在寻找改变，”他说。“但当Waymo出现时，我被他们的团队、使命以及迄今为止所取得的成就震惊了——很明显，在这股人工智能的助力下，他们将会迅速成长并成为推动世界变革的巨大力量。”

虽然我在攀登旧金山那条陡峭的街道时感到有些焦虑，但Thirumalai却没有这样的担忧。他在接受Waymo联合首席执行官Dmitri Dolgov采访时乘坐了自己人生中的第一次Waymo乘车，“这令我大为震撼，”他说。

他说，Waymo在旧金山市中心的早高峰中导航，并成功驶上了电报 hill，一直开到了俯瞰整个城市和海湾的柯伊特塔。为了明确一点，没有一群人类巫师在幕后帮助这辆 Waymo 车辆行驶：“对于我们来说，在每月数以百万计的里程中实现这一点极其困难，”他说，尽管他强调如果一辆Waymo汽车陷入困境并需要额外的信息时，远程操作员可以介入提供帮助。

当Thirumalai乘坐的Waymo安全地穿梭在狭窄的街道上，预判行人的行为，并且还能处理双排停车的情况时，他意识到自己正在经历一次非常特别的乘车体验。“我心想，这些人已经把自动驾驶技术发展到了与人类驾驶不相上下，甚至更好的水平了——而这一切正发生在人工智能迅速崛起的时候。”他说。

当Thirumalai从他的Waymo乘车回来后，他向妻子讲述了这次经历。“我说，天哪，我看到了未来，”他回忆道。“如果我不参与其中，那我会是个傻瓜。”

关于《独家：Waymo工程高管讨论将驱动汽车进入新城市的自动驾驶AI模型》的评论

暂无评论

发表评论

摘要

当我在五月份在Instagram上发布关于我首次乘坐自动驾驶的、由AI驱动的Waymo汽车的照片和视频时——视频中显示的是空无一人的驾驶座，方向盘在一个繁忙街道上平稳地左转——回应从“哎呀”、“这真是太疯狂了”到“不不不”。虽然在过去，Waymo对其AI驱动的自动驾驶技术的具体工作原理一直比较谨慎，但现在该公司认为提供更深入的技术细节对于获得公众对无人驾驶汽车的广泛接受至关重要。例如，英国初创公司Wayve（背后有微软和Meta首席科学家扬·乐昆的支持）并不使用LiDAR（尽管它使用高清晰度摄像头），而是依赖于许多车辆标准配备的摄像头和超声波传感器，并且专注于开发一个单一的生成式AI“世界模型”，该模型可以将视觉数据进行解释并作为一个集成系统做出驾驶决策。需要明确的是，Waymo汽车背后没有成千上万的人类巫师在帮助它行驶：“随着我们每个月要行驶数百万英里，这对我们来说是很难规模化实现的，”他说，尽管他强调说人类远程操作员可以在Waymo汽车遇到困境并需要更多上下文信息时介入。当Thirumalai驾驶着他的Waymo安全穿过狭窄街道、预判行人甚至处理双排停车的情况时，他意识到自己经历了一次非常特别的乘车体验。“