NVIDIA机器人总监:Tesla FSD v14是第一个通过“物理图灵测试”的AI

2025-12-24 19:44:49 英文原文

作者:Simon Alvarez

新闻动态

在测试 FSD v14 后,Fan 表示,他对 FSD 的体验一开始感觉很神奇,但很快就开始感觉像例行公事。

图片来源:Grok Imagine

NVIDIA 机器人总监 Jim Fan 称赞特斯拉的全自动驾驶(监督)v14 是第一个通过他所说的“物理图灵测试”的人工智能。

在测试 FSD v14 后,Fan 表示,他对 FSD 的体验一开始感觉很神奇,但很快就开始感觉像例行公事。就像今天的智能手机一样,现在删除它会“造成严重伤害”。

Jim Fan 的 FSD v14 实践印象

Fan 是具身人工智能领域的领先研究员,目前正在 NVIDIA 解决物理人工智能问题,并带头领导该公司的 GR00T 项目计划,他指出,他实际上在特斯拉的比赛中迟到了。然而,他是第一个尝试 FSD v14. . . 

“我很晚才拥有特斯拉,但却是最早尝试 FSD v14 的人之一。这也许是我第一次体验通过物理图灵测试的人工智能:在工作了一整天后,你按下按钮,躺下,无法判断是神经网络还是人类开车送你回家,”范在帖子中写道在 X 上。 

范补充道:尽管我确切地知道机器人学习是如何工作的,但我仍然觉得看着方向盘自动转动很神奇。首先感觉超现实,接下来就变得司空见惯。然后,就像智能​​手机一样,主动拿走它会造成伤害。这就是人类如何被重新连接并被上帝般的技术所束缚的方式。”

我很晚才拥有特斯拉,但也是最早尝试 FSD v14 的人之一。这也许是我第一次体验通过物理图灵测试的人工智能:在一整天的工作之后,你按下一个按钮,躺下来,无法判断是神经网络还是人类开车送你回家。https://t.co/PDOn6ZFTZA— 吉姆·范 (@DrJimFan)2025 年 12 月 23 日

物理图灵测试

最初的图灵测试是由艾伦·图灵于 1950 年提出的,旨在确定机器是否能够表现出与人类相同或无法区分的行为。通过专注于基于文本的对话,最初的图灵测试为自然语言处理和机器学习设定了很高的标准。 

当今的大型语言模型已经通过了这项测试。然而,以类人方式交谈的能力与执行现实世界的问题解决或物理交互是完全不同的挑战。因此,范引入了物理图灵测试,该测试挑战人工智能系统通过物理动作展示智能。

根据范的评论,特斯拉展示了这些智能的身体动作带有 FSD v14。埃隆·马斯克 (Elon Musk) 同意 NVIDIA 高管的观点,他在 X 上的一篇帖子中表示FSD v14,“你可以感觉到意识正在成熟。”马斯克还称赞特斯拉人工智能,称其为当今最好的“现实世界人工智能”。西蒙是一位经验丰富的汽车记者,对电动汽车和清洁能源充满热情。

他对埃隆·马斯克设想的世界着迷,希望有一天能够到达火星(至少作为游客)。如需故事或提示,甚至只是简单的打个招呼,请向他的电子邮件发送消息,simon@teslarati.com或者他在 X 上的手柄,@ResidentSponge

埃隆·马斯克

这一里程碑凸显了 Starlink 的加速增长,目前每天新增用户超过 20,000 名。

已发表

48 秒前上

2025 年 12 月 24 日

图片来源:星链/X

SpaceX 的 Starlink 卫星互联网服务继续在全球快速扩张,活跃客户数在突破 800 万大关几周后就突破了 900 万。 

这一里程碑凸显了 Starlink 的加速增长,目前每天新增用户超过 20,000 名。

900 万客户

SpaceX 在 X 上的一篇帖子中表示,Starlink 目前为 155 个国家、地区和市场的超过 900 万活跃用户提供服务。

该公司在 11 月初的客户数量达到 800 万,这意味着在不到 7 周的时间内增加了大约 100 万订户,即平均每天新增用户约 21,275 名。 

“Starlink 正在将 155 个国家、地区和许多其他市场的超过 900 万活跃客户与高速互联网连接起来,”Starlink 在其官方 X 帐户上的一篇文章中写道。SpaceX 总裁格温·肖特韦尔 (Gwynne Shotwell) 也表示庆祝里程碑“非常感谢我们所有的客户,并祝贺 Starlink 团队推出了如此令人难以置信的产品,”她写道。 

这一增长率同时反映了需求增加服务欠缺地区的宽带和 Starlink 不断扩大的卫星星座,该星座目前包括 9,000 多颗低地球轨道卫星,旨在在全球范围内提供高速、低延迟的互联网。

星链的势头

星链的势头一直在增强。SpaceX 报告称,2024 年 12 月 Starlink 客户数量为 460 万,随后到 2025 年 8 月达到 700 万,11 月达到 800 万。独立数据还表明 Starlink 使用量正在急剧上升,Cloudflare 报告称,正如一份报告中指出的那样,Starlink 用户的全球网络流量在 2025 年增加了一倍多内幕报告。

Starlink 的发展势头与 SpaceX 更广泛的财务前景越来越紧密地联系在一起。埃隆·马斯克曾表示,卫星网络是“迄今为止”该公司最大的收入驱动因素,有报道称 SpaceX 可能会最早在明年进行首次公开​​募股,估值高达 1.5 万亿美元。马斯克过去还曾暗示,星链未来可能会进行自己的首次公开募股。 

新闻动态

该更新是在 FSD v14.2.2 开始向客户推出后一天发布的。 

已发表

59 分钟前

2025 年 12 月 24 日

图片来源:Grok

今年圣诞节,特斯拉将开夜车,在 FSD v14.2.2 开始向客户推出的第二天,特斯拉 AI 团队悄悄推出了全自动驾驶(受监督)v14.2.2.1。 

特斯拉车主分享对 FSD v14.2.2.1 的见解

Tesla 长期车主兼 FSD 测试员@BLKMDL3分享了在洛杉矶多雨、积水和车道线褪色的情况下使用 FSD v14.2.2.1 进行几次驾驶后的一些见解。他报告了零转向犹豫或卡顿、自信的变道以及精确执行的操作,这些都让人想起特斯拉在奥斯汀的无人驾驶机器人出租车的性能。

停车表现给人留下了深刻的印象,大多数停车位都完美地固定住了,包括急转弯、急转弯,一次尝试就没有转向摇晃的情况。一次轻微的偏移只是由于另一辆车停在线路上而发生的,FSD 额外调整了几英寸。在通常会抹掉道路标记的雨中,FSD 比人类更好地可视化车道和转弯线,在进入新街道时也能完美定位自己。

今晚,我们把它带到了一条黑暗、潮湿、曲折的峡谷路上,上下山,一切顺利,正如预期的那样。保持在车道中央,保持良好的速度,并给人一种鼓舞人心的转向感觉,比大多数人类驾驶员更好地处理这些弯曲的道路,”这位特斯拉车主在 X 上的一篇帖子中写道。

5 个带有 FSD v14.2.2.1 的驱动器,以下是我的想法:

仍然看到零转向犹豫或卡顿,自信和伟大的车道变化。今晚到目前为止,我所有的驾驶体验都是在雨中进行的,它在积水路面上的表现给我留下了深刻的印象……pic.twitter.com/W6RwqnnChe– 扎克 (@BLKMDL3)2025 年 12 月 24 日

好消息$特斯拉FSD V14.2.2.1 现已推出 ð¥

此维护版本旨在完善 14.2.2 中的可用内容 ð¥ 自 v14 系列开始以来,更新速度快如闪电 ð¥

1、V14.1 (2025.32.8.5) – 2025 年 10 月 6 日
2、V14.1.1 (2025.32.8.6) – 2025 年 10 月 12 日…pic.twitter.com/cdhioquSU8– 明 (@tslaming)2025 年 12 月 24 日

Tesla 的 FSD v14.2.2 更新

就在 FSD v14.2.2.1 发布前一天,特斯拉推出了FSD v14.2.2,其重点是更流畅的现实世界性能、更好的障碍物感知和精确的行程结束路线。根据更新的发行说明,FSD v14.2.2 升级了视觉编码器神经网络,具有更高分辨率的功能,增强了对紧急车辆、道路障碍物和人体手势的检测。

新到货选项还允许用户选择首选的还车方式,例如停车场、街道、车道、停车场或路边,导航图钉会自动调整到理想位置。其他改进包括紧急车辆靠边停车、针对堵塞道路的实时视觉绕行、改进的大门和碎片处理以及用于定制驾驶风格的速度配置文件。

埃隆·马斯克

Grok 的幻觉率为 8%,客户评级为 4.5,一致性为 3.5,停机时间为 0.07%,总体风险评分仅为 6。

已发表

3小时前

2025 年 12 月 24 日

英国政府,CC BY 2.0,来自维基共享资源

赌场游戏聚合商 Relum 于 2025 年 12 月进行的一项研究表明,埃隆·马斯克 (Elon Musk) 的 Grok 是工作场所使用的最可靠的人工智能聊天机器人之一,在测试的 10 个主要模型中,其幻觉率最低,仅为 8%。 

相比之下,市场领导者 ChatGPT 的幻觉率最高,达到 35%,仅次于 Google 的 Gemini,后者的幻觉率高达 38%。尽管人工智能模型的市场知名度较低,但调查结果凸显了 Grok 的事实实力。

Grok 的幻觉指标最高

研究对聊天机器人的幻觉率、客户评级、响应一致性和停机率进行了评估。然后,聊天机器人被分配了从 0 到 99 的可靠性风险评分,分数越高表明问题越大。

Grok 达到了 8%幻觉率、4.5 的客户评级、3.5 的一致性和 0.07% 的停机时间,总体风险评分仅为 6。DeepSeek 紧随其后,幻觉率为 14%,停机时间为零,风险评分为 4。ChatGPT 的高幻觉和停机率使其风险评分最高,为 99,其次是 Claude 和 Meta AI,可靠性风险评分分别为 75 和 70。分别。 

为什么低幻觉很重要

雷鲁姆首席产品官 Razvan-Lucian Haiduc 分享了他对该研究结果的看法。– 大约 65% 的美国公司现在在日常工作中使用人工智能聊天机器人,近 45% 的员工承认他们曾使用这些工具共享敏感的公司信息。这些数字很好地表明了聊天机器人在日常工作中的重要性。 

– 对人工智能工具的依赖可能会进一步增加,因此公司应根据聊天机器人的可靠性和适合其特定业务需求的程度来选择聊天机器人。每个人都使用的聊天机器人不一定最适合您的行业或为您的任务提供准确的答案。”

在某种程度上,该研究揭示了人工智能聊天机器人的受欢迎程度和性能之间的显着差距,Grok 的低幻觉率使其成为精度关键型应用程序的有力选择。尽管事实上 Grok 的用户使用率并不高,至少与 ChatGPT 等更主流的人工智能应用程序相比是这样。 

关于《NVIDIA机器人总监:Tesla FSD v14是第一个通过“物理图灵测试”的AI》的评论


暂无评论

发表评论

摘要

NVIDIA 机器人总监吉姆·范 (Jim Fan) 称赞特斯拉的全自动驾驶(监督)v14 通过了“物理图灵测试”,并指出长时间使用后感觉就像是与人类驾驶员相媲美的智能物理动作。埃隆·马斯克对此表示同意,并表示 FSD v14 表现出不断增强的感知力。此外,特斯拉悄悄发布了更新FSD v14.2.2和FSD v14.2.2.1,增强了现实世界的性能和障碍物感知。与此同时,SpaceX 的 Starlink 全球活跃客户超过 900 万,反映出宽带接入和卫星部署的显着增长。