特斯拉最近发布了一项非常详细的专利,解释了其基于视觉的占用网络的内部工作原理。该专利的名称为基于视觉的占用确定的人工智能建模技术并于2026年3月12日正式发布。
归功于工程师团队,其中包括阿肖克·埃鲁斯瓦米该文件深入探讨了特斯拉如何在不依赖雷达或激光雷达的情况下利用人工智能来理解物理世界。
了解体素网格
特斯拉的核心占用网络围绕体素旋转。体素本质上是一个三维像素,代表车辆周围体积网格内的特定点。为了构建这个网格,人工智能模型从车辆的八个外部摄像头获取图像数据。然后系统执行模型来预测每个体素是否被具有质量的物体占据。
该专利指出,由于手动标记数百万个 3D 数据点将非常耗时,因此特斯拉严重依赖无监督训练方法大规模训练这些模型。
可变分辨率和子体素
该专利中透露的最有趣的细节之一是特斯拉如何通过动态调整这些体素的大小来管理计算能力。体素的默认大小是每个顶点 33 厘米。对于位于远处或直接行驶表面之外的物体来说,该尺寸通常是可以接受的。
然而,FSD 可以将占用区域和距车辆阈值距离内的体素尺寸减小至 10 厘米。这允许在最重要的地方实现更高的粒度。神经网络甚至可以通过将占用空间划分为更小的子体素来预测部分占用。
这使得 FSD 能够准确识别弯曲物体的确切形状。分析服务器还可以使用三线性插值来估计体素内任何特定点的占用状态。
时间融合和 3D 语义
特斯拉的人工智能不仅仅孤立地看待静态框架。人工智能模型使用转换器将 2D 图像数据聚合为统一的 3D 表示。然后它将当前的 3D 空间与先前时间戳的表示。这种空间和时间数据的组合允许网络计算占用流量。占用流指示移动体素的确切速度。
最后,FSD 应用 3D 语义数据来识别对象实际是什么。它可以区分一组占用的体素是否代表移动的汽车、静态的建筑物或街道路缘。该系统旨在优先考虑某些语义形状。例如,靠近自我的移动车辆将比远离道路的静态建筑物进行更彻底的分析。
为车辆和 Optimus 提供动力
所有这些数据都会不断聚合成可查询的数据集。FSD 可以不断查询该数据集以接收占用状态并做出实时导航决策。此外,该数据集还用于生成显示在车内用户界面上的 3D 环境地图。
虽然该专利主要关注自动驾驶汽车,但它证实了底层技术具有高度适应性。该文件特别指出,通用双足人形机器人可以利用这种完全相同的基于视觉的占用网络来导航各种地形。
如果您喜欢这篇文章,我们建议您阅读我们与 FSD 相关的 Tesla 专利的完整系列:
订阅我们的时事通讯,了解最新的 Tesla 新闻、即将推出的功能和软件更新。
特斯拉似乎正在加速其自动驾驶网约车的雄心。观察员最近在亚利桑那州凤凰城的一个停车场发现了一支由大约 60 辆特斯拉 Model Y 车辆组成的车队。这个停车场的车辆表明,凤凰城不再只是一个测试环境,而是更广泛的 Robotaxi 推广的活跃集结地。
后置摄像头清洗器已确认
关于这支新发现的车队最能揭示问题的细节是标准消费车辆上没有的硬件修改。停车场里展示的所有 Model Y 似乎都有一个专用后置摄像头清洗器。虽然这些车辆没有发现独特的中继相机清洗器在奥斯汀,后置摄像头清洗器仍然是 Robotaxi 特有的改动,消费类车辆上没有这种改动。
在完全自主的系统中,传感器卫生绝对至关重要。人类乘客不能下车去擦拭脏的相机镜头。通过标准化其 Robotaxi 专用车队的后置摄像头喷雾器,特斯拉证明这些车辆已明确配置为在不同环境条件下进行无人监督操作。然而,我们尚未看到该功能被添加到新的消费车辆中。
从奥斯汀扩大规模
到目前为止,特斯拉的 Robotaxi 试点项目主要集中在德克萨斯州奥斯汀,与规模相对较小的车队合作,在缓慢扩张的地理围栏内提供有人监督和无人监督的乘车服务。60 辆支持 Robotaxi 的 Model Y 突然出现在凤凰城,这对于特斯拉瞄准的下一个主要城市之一来说是一次重大扩张。
部署如此规模的预建车队可能表明特斯拉已经吸收了德克萨斯州的运营经验并准备扩张。菲尼克斯预计将成为 2026 年上半年首批上线的主要市场之一,其他阳光地带城市如达拉斯、休斯顿、迈阿密、奥兰多、坦帕和拉斯维加斯。这些地区的共同特点是气候宜人、道路形状简单、网约车需求异常高。
缩小与 Cybercab 的差距
尽管特斯拉正在积极准备即将生产的专用 Cybercab,但 Model Y 仍将继续作为当前 Robotaxi 网络的支柱。目前在凤凰城部署的舰队可能在未来几个月内发挥重要的双重作用。
就像奥斯汀的车队一样,该车队将收集本地化的地图和路线数据,以帮助完善 FSD 和特斯拉的 Robotaxi 控制网络,以适应凤凰城交通模式的特殊性以及任何具有挑战性和独特的十字路口。这还包括收集所有信息潜在的下车点和上车点显示在 Robotaxi 应用程序中。
一旦 Robotaxi 网络准备就绪,特斯拉只需打开开关即可立即开始创收。随着今年晚些时候 Cybercab 产量的增加以及专用装置的大规模上市,这些专用的 Model Y 可能会转变为支持角色,或者被重新部署以在全国范围内开辟更多新市场。
埃隆·马斯克最近确认备受期待的 FSD v14.3 更新已正式掌握在员工测试人员手中,并将在不久的将来向抢先体验的客户推出。
在一系列专注于稳定性的增量 FSD v14.2 补丁之后,即将发布的 v14.3 版本可能会在 FSD 功能方面实现重大飞跃。这可能包括从智能停车功能到驱逐的任何内容,用声音控制 FSD。
让我们来看看 FSD v14.3 中可能包含的一些我们一直在等待的 FSD 功能。
更高水平的推理和坑洼避免
马斯克最近更新了 FSD v14 路线图,并指出这组特定的更新旨在使车辆感觉几乎有知觉。虽然之前的版本严重依赖于对直接障碍的反应,但 v14.3 预计将在实时推理方面进行大规模升级。神经网络将能够将复杂的逻辑动态应用于边缘情况和不可预测的城市环境。
这种升级的推理直接转化为更平稳、更安全的乘坐。在 v14.2 更新中,特斯拉对道路碎片避免进行了重大改进。14.3 版可以更进一步,引入先进的坑洞检测和避免功能。车辆可以识别退化的路面并平稳地调整其路径以保护您的轮胎和悬架,而不会出现不稳定的转向。
在下面的视频中,FSD 改变车道是为了避开路上的阴影,但这很可能是一个更大的坑洼。
Fsd 14.2.2.5 转向出现阴影。我退出并报告了该问题pic.twitter.com/7bse3vKymK
– 埃利亚斯·马丁内斯 (@EliasMartinez)2026 年 3 月 20 日
真正智能召唤 Cybertruck
特斯拉的“实际智能召唤”功能已经改变了从拥挤的停车场取回车辆的游戏规则,但众所周知,棱角分明的 Cybertruck 却被排除在外。
随着NHTSA 对 Actual Smart Summon 的调查最近结束,我们预计 Summon 的第一个版本最终将为 Cybertruck 车主推出。此外,我们希望在特斯拉 Robotaxi FSD 的改进基础上看到智能召唤逻辑的一些改进,以实现在狭小空间内的低速机动。
这意味着更高的可靠性、在行人周围更顺畅的导航以及在复杂停车场中更果断的路线。
我们希望这些改进能够在 FSD 14.3 中实现。
取消和更智能的停车
也许 v14.3 中最需要的功能是 Banish。作为 Autopark 的终极进化,Banish 将允许驾驶员在目的地入口处下车。然后,汽车可以自动导航停车场,找到有效的停车位,然后自行停车。
为了支持这一点,特斯拉可能会彻底改变其停车逻辑。早期版本的 Autopark 有时会在上下文位置选择方面遇到困难,有时会尝试使用障碍空间或无法驶入指定的超级充电站。
FSD v14.3 可能会改进停车位选择,确保车辆智能识别合法可用的停车位。
虽然我们等待《Banish》已有多年,但在其最终发布之前,我们很可能会看到停车和停车位选择方面的改进。
车辆到车队通信
FSD 最令人兴奋的新增功能之一是车辆到车队通信的引入。这个功能是最初宣布一直回到 v12.4 版本,但最终从未实现。
这项技术将使特斯拉能够与车队的其他车辆共享高度本地化的实时数据。如果一辆特斯拉遇到严重坑洼、临时封路或突然发生的交通危险,它会立即向车队的其他车辆发出警报。其他接近同一区域的特斯拉汽车会自动接收这些信息,并在危险在相机上可见之前调整其速度或路线。
特斯拉可能已经采用了类似的策略来安排其机器人出租车的路线,但看到这种逻辑广泛应用于整个车队将是迈向真正的无人监督自动驾驶的又一大步。
扩展前置摄像头清洁
随着特斯拉向无人监督的自动驾驶迈进,保持车辆摄像头的清洁绝对至关重要。去年,特斯拉介绍了前置摄像头清洁技术这改善了前置摄像头的清洁,但仅限于较新的 2026+ Model Y 变体。
我们可以看到特斯拉将软件支持扩展到其他车辆型号。
虽然 FSD 14.3 的重点是改进推理,但我们很可能会看到我们一直在等待的其他 FSD 功能的引入,例如改进的停车选择。
FSD v14.3 正在成为近期最重要的 FSD 更新之一。我们将密切关注预计将在未来一两周内推出的抢先体验。