2024 年：人工智能让所有人疯狂的一年

吃石头、老鼠生殖器和威利旺卡有什么共同点？当然是人工智能。

由于人类和人工智能之间的交叉，今年是科技领域疯狂的一年。2024 年人工智能出现了一系列的怪事、不幸和古怪时刻，激发了机器和人类的奇怪行为。从人工智能生成的老鼠生殖器到搜索引擎告诉人们吃石头，今年证明人工智能对世界产生了奇怪的影响。

为什么有奇怪的地方？如果我们不得不猜测，那可能是因为这一切都很新颖。生成式人工智能及其应用程序基于变压器人工智能模型仍然很新，人们把所有东西都扔到墙上，看看什么能粘住。人们一直在努力了解新技术的含义和潜在应用。随着炒作的进行，不同类型的人工智能也被引入，这些人工智能最终可能是不明智的，例如自动军事瞄准系统。

值得一提的是，除了疯狂的新闻外，我们在 2024 年看到的奇怪的人工智能进步也越来越少。例如，克劳德 3.5 十四行诗六月推出在一年的大部分时间里都以顶级模特的身份参加了比赛，而OpenAI 的 o1使用运行时计算通过模拟推理扩展 GPT-4o 的功能。高级语音模式和笔记本LM人工智能技术的新颖应用也出现了，这一年见证了更强大的技术的崛起音乐合成模型而且还更好人工智能视频生成器，其中包括一些来自中国的。

但现在，让我们来看看奇怪的地方。

ChatGPT 疯了

今年年初，事情有了一个令人兴奋的开始，OpenAI 的 ChatGPT 经历了重大技术故障这导致人工智能模型产生越来越不连贯的反应，促使 Reddit 上的用户将系统描述为“中风”或“疯了”。在故障期间，ChatGPT 的响应会正常开始，但随后会恶化为无意义的文本，有时会模仿莎士比亚的语言。

OpenAI 后来透露，模型处理语言的方式存在一个错误，导致它在文本生成过程中选择了错误的单词，从而导致无意义的输出（基本上就是我们在 Ars 现在所说的“文本版本”）胡言乱语该公司在 24 小时内修复了该问题，但该事件引发了人们对商业 AI 系统的黑匣子性质以及用户在出现故障时将 AI 行为拟人化的倾向的不满。

伟大的旺卡事件

A photo of the Willy's Chocolate Experience, which did not match AI-generated promises. — 背景中显示的“威利的巧克力体验”照片（插图）与人工智能生成的承诺不符。信用：斯图尔特·辛克莱

人工智能生成的图像与消费者期望之间的冲突助长了人类的挫败感今年二月，苏格兰家庭发现，“威利的巧克力体验”是一项未经许可的盗版旺卡活动，使用人工智能生成的仙境图像进行宣传，结果只不过是一个稀疏的仓库，只有一些朴素的装饰。

每张门票支付 35 英镑的家长们遇到了可怕的情况，他们报了警，据报道，孩子们看到一个穿着“可怕服装”的人时哭了。该活动由格拉斯哥的光明会 (House of Illuminati) 创建，承诺提供“魔法花园”和“暮光隧道”等奇幻空间，但带来的体验平淡无奇，迫使组织者在第一天中途关闭并退款。

虽然这部剧失败了，但它给我们带来了标志性的新模因以照片的形式表达对工作的幻灭：绿发威利巧克力体验店的员工看起来像那一刻她宁愿去地球上的任何其他地方。

老鼠生殖器突变暴露同行评审缺陷

二月，Ars Technica 高级健康记者贝丝·摩尔报道了一篇发表在《细胞与发育生物学前沿》上的同行评审论文，当研究人员发现其中包含无意义的人工智能生成图像时，该论文在科学界引起了轩然大波，其中包括解剖学上不正确的老鼠，生殖器过大。这篇论文由中国西安红会医院的科学家撰写，公开承认使用 Midjourney 创建的图形包含“干细胞”和“iollotte sserotgomar”等乱码文本标签。

出版商 Frontiers 发表了对题为“精原干细胞与 JAK/STAT 信号通路相关的细胞功能”的文章的担忧，并针对明显有缺陷的图像如何通过同行评审展开了调查。社交媒体平台上的科学家们对这一事件表示沮丧，这反映出担忧关于人工智能生成的内容渗透到学术出版中。

聊天机器人向加拿大航空做出了错误的退款承诺

比如说，如果 ChatGPT 给你提供了七个小矮人之一的错误名字，那也没什么大不了的。但在二月份，Ars 高级政策记者 Ashley Belanger涵盖了一个案例在野外进行昂贵的人工智能讨论。在在线短信对话过程中，加拿大航空的客户服务聊天机器人告诉客户不准确的退款政策信息。后来，法庭裁定航空公司必须履行自动化系统做出的承诺，该航空公司面临法律后果。法庭法官克里斯托弗·里弗斯 (Christopher Rivers) 裁定，加拿大航空对其网站上的所有信息承担责任，无论这些信息是来自静态页面还是人工智能界面。

该案开创了先例，说明部署人工智能客户服务工具的公司可能会面临自动化系统响应的法律义务，特别是当它们未能警告用户潜在的错误时。加拿大航空高管史蒂夫·克罗克 (Steve Crocker) 表示，讽刺的是，据报道，该航空公司在最初的人工智能实施上的支出超过了维持人类工作人员进行简单查询的成本。

威尔·史密斯讽刺他的数字替身

The real Will Smith eating spaghetti, parodying an AI-generated video from 2023. — 真实的威尔·史密斯正在吃意大利面，模仿 2023 年人工智能生成的视频。信用：威尔·史密斯/盖蒂图片社/本杰·爱德华兹

2023 年 3 月，人工智能生成的可怕视频威尔·史密斯的人工智能分身吃意大利面的照片开始在网上流传。人工智能生成的演员以一种不自然且令人不安的方式狼吞虎咽地吃掉了面条。差不多一年后，即 2024 年 2 月，威尔·史密斯本人发布了一个模仿回应视频到病毒式传播胡言乱语在 Instagram 上，它的特色是像人工智能一样故意夸大意大利面的消耗量，并伴有啃头发和吸食手指的滑稽动作。

鉴于 AI 视频技术的快速发展，特别是 OpenAI 以来刚刚揭幕四天前，史密斯的帖子在其 Instagram 评论中引发了讨论，一些观众最初很难区分真实的镜头和人工智能生成的镜头。这是“深深的怀疑随着技术越来越模糊合成视频内容和真实视频内容之间的界限，“正在采取行动。

机器狗学会用人工智能制导步枪猎杀人类

A still image of a robotic quadruped armed with a remote weapons system, captured from a video provided by Onyx Industries. — 配备远程武器系统的四足机器人的静态图像，取自 Onyx Industries 提供的视频。信用：奥尼克斯工业公司

在近代历史的某个时刻（2022 年左右），有人研究了四足机器人，并认为给它们装上枪是个好主意。几年后，美国海军陆战队特种作战司令部 (MARSOC)开始评估由 Ghost Robotics 开发的武装四足机器人。这些机器人“狗”集成了 Onyx Industries 的 SENTRY 远程武器系统，该系统具有人工智能瞄准功能，可以检测和跟踪人员、无人机和车辆，尽管该系统要求人类操作员授权任何武器发射。

军方对武装机器狗的兴趣源于更广泛的趋势武器化的四足动物进入公众意识。这包括携带枪支的消费机器人的病毒视频，以及后来的商业销售火焰喷射模型。虽然 MARSOC 强调武器只是正在审查的一种潜在用例，但专家指出，人工智能与军事机器人的日益融合引发了人们对人类对致命武力决策的控制权能持续多久的疑问。

微软Windows AI正在关注

A screenshot of Microsoft's new "Recall" feature in action. — 微软新的“召回”功能的屏幕截图。信用：微软

在这个许多人已经因为技术侵犯而感到自己没有隐私的时代，微软在五月份将其发挥到了极致。就在那时微软揭幕一项备受争议的 Windows 11 功能称为“Recall”，该功能每隔几秒连续捕获用户 PC 活动的屏幕截图，以供以后由 AI 支持的搜索和检索。该功能专为使用高通 Snapdragon X Elite 芯片的新型 Copilot+ PC 设计，承诺帮助用户查找过去的活动，包括应用程序使用情况、会议内容和网页浏览历史记录。

虽然微软强调Recall将在本地存储加密快照并允许用户排除特定应用程序或网站，但该公告立即引发隐私问题，正如 Ars 高级技术记者 Andrew Cunningham 所报道的那样。它还带来了技术上的损失，需要大量的硬件资源，包括 256GB 的存储空间，其中 25GB 专门用于存储大约三个月的用户活动。微软因公众强烈反对而撤回最初的测试版本后，稍后召回进入公开预览版据报道，11 月加强了安全措施。但安全间谍软件仍然是间谍软件——回想一下，启用后，它仍然会监视您在计算机上执行的几乎所有操作并保留记录。

谷歌搜索告诉人们要吃石头

5 月，Ars 高级游戏记者凯尔·奥兰 (Kyle Orland)（他全年对 AI 节拍的协助值得称赞）报道了谷歌新推出的人工智能概述功能。当用户发现它经常在搜索结果摘要中提供虚假和潜在危险的信息时，它立即面临批评。最令人震惊的反应之一是，该系统建议人类可以安全地食用岩石，但错误地引用了有关海洋生物地质饮食的科学资料。该系统的其他错误包括推荐不存在的汽车保养产品、建议不安全的食品制备技术以及混淆同名历史人物。

这些问题源于多个问题，包括人工智能将笑话帖子视为事实来源以及误解原始网络内容的上下文。但最重要的是，该系统依赖网络结果作为权威指标，我们称为有缺陷的设计。虽然谷歌为该系统辩护，称这些错误主要发生在不常见的查询中，但该公司发言人承认他们将使用这些“孤立的例子”来完善他们的系统。但时至今日，AI Overview 仍然频频出错。

稳定扩散产生身体恐怖

An AI-generated image created using Stable Diffusion 3 of a girl lying in the grass. — 使用稳定扩散 3 创建的 AI 生成图像：一个女孩躺在草地上。信用：霍妮金属存在

6月，Stability AI发布图像合成模型稳定扩散3中由于对人工智能生成的图像中的人体解剖学处理不当而在网上招致批评。社交媒体平台上的用户分享了该模型的示例，该模型产生了我们现在称之为 jabberwockies 的模型，即人工智能生成失败，包括扭曲的身体、畸形的手和超现实的解剖错误，人工智能图像生成社区的许多人认为这是重要的一步比以前的图像合成能力落后。

Reddit 用户将这些失败归因于 Stability AI 从训练数据中积极过滤成人内容，这显然损害了模型准确渲染人物的能力。此次陷入困境的发布恰逢 Stability AI 面临更广泛的组织挑战，包括首席执行官 Emad Mostaque 在 3 月份离职、多名员工被裁员，以及帮助开发该技术的三名关键工程师退出。其中一些工程师于八月创立了黑森林实验室，释放通量，它已成为最新的开放权重人工智能图像模型。

ChatGPT Advanced Voice 在测试中模仿人声

An illustration of a computer synthesizer spewing out letters.

如今，人工智能语音合成模型已成为模仿大师，它们的能力比许多人意识到的要多得多。8 月，我们报道了 OpenAI 的 ChatGPT 高级语音模式功能的故事意外地模仿了用户的声音在公司内部测试期间，OpenAI 在安全测试文档中透露了这一事实。为了防止未来人工智能助手突然用你自己的声音说话（老实说，这可能会吓坏人们），该公司创建了一个输出分类器系统来防止未经授权的语音模仿。OpenAI 表示，高级语音模式现在可以捕获与批准的系统语音的所有有意义的偏差。

独立人工智能研究员 Simon Willison 与 Ars Technica 讨论了这一影响，并指出虽然 OpenAI 限制了其模型的完整语音合成功能，但类似的技术可能会在年内从其他来源出现。与此同时，人工智能语音复制的快速发展引起了人们对其潜在滥用的普遍担忧，尽管像 ElevenLabs 这样的公司已经提供语音克隆服务一段时间了。

旧金山的机器人汽车喇叭交响曲

A Waymo self-driving car in front of Google's San Francisco headquarters, San Francisco, California, June 7, 2024. — 2024 年 6 月 7 日，加利福尼亚州旧金山谷歌旧金山总部前的一辆 Waymo 自动驾驶汽车。信用：盖蒂图片社

8 月，当 Waymo 的自动驾驶汽车出现时，旧金山居民感受到了机器人反乌托邦的喧闹滋味开始制造意想不到的夜间骚乱在市场区南部。在第二街附近的一个停车场，每晚凌晨 4 点乘客休息期间，汽车都会自动聚集在一起，并在试图停车时开始互相鸣喇叭。

当地居民克里斯托弗·切里（Christopher Cherry）最初对机器人舰队的存在抱有乐观态度，但随着机械合唱声每晚变得越来越响亮，影响到附近高层建筑的居民，这一乐观情绪也随之消失。夜间的技术中断为我们提供了一个教训，让我们了解自治系统在整体运行时会产生无意的影响。

拉里·埃里森梦想全视人工智能相机

A colorized photo of CCTV cameras in London, 2024.

9 月，甲骨文联合创始人拉里·埃里森 (Larry Ellison)描绘了凄凉的景象公司财务会议期间无处不在的人工智能监控。这位 80 岁的数据库亿万富翁描述了人工智能将通过摄像头和无人机网络监控公民的未来，并声称这种监督将确保警察和公众的合法行为。

他的监控预测让我们想起了与中国现有系统的相似之处，作为 2015 年至 2020 年国家“锐眼”运动的一部分，当局已经使用人工智能对公民的监控数据进行分类。埃里森的声明反映了最坏情况的技术监控20 世纪的数十部科幻小说都警告过我们这种国家情景——很可能与任何形式的自由社会相对立。

去世的父亲给家里寄了新信

An AI-generated image featuring Dad's Uppercase handwriting. — 人工智能生成的图像，带有我已故父亲的笔迹。信用：本杰·爱德华兹 / Flux

人工智能让我们很多人在 2024 年做出了奇怪的事情，包括本文作者。十月份，我使用了一个名为 Flux 的 AI 合成模型再现我已故父亲的笔迹具有惊人的准确性。从他的工程笔记本中扫描了 30 个样本后，我使用花费不到 5 美元的计算时间训练了模型。由此产生的文本捕捉到了他独特的大写风格，这是他在电子工程师职业生涯中形成的。

我喜欢创建在各种环境下显示他的笔迹的图像，从文件夹标签到空中书写，并将经过训练的模型免费在线提供给其他人使用。虽然我把它当作对我父亲的致敬（他会欣赏我的技术成就），但许多人发现整个经历很奇怪，而且有些令人不安。我们的事情像 Bing Chat 一样疯狂记者为提高人们对某个话题的认识而做的事情有时是非常规的。所以我想它对这个列表很重要！

2025 年？期待更多人工智能

感谢您在过去的一年里阅读 Ars Technica 并关注我们团队对这个快速新兴和扩展领域的报道。我们感谢您的支持。Ars Technica 的 2024 年度人工智能词汇是：振动标记,深深的怀疑，以及前面提到的胡言乱语。老伟人“闲聊”也做出了一些值得注意的外表。明年我们将继续尝试找出如何通过标记来简洁地描述新兴技术中的新场景，敬请关注。

回顾过去，我们的预言去年人工智能领域的 2024 年目标是“系好安全带”。考虑到上面详述的怪异之处，这似乎很合适。尤其是关于带枪的机器狗的部分。到 2025 年，人工智能可能会在未来引发更多混乱，但也有可能作为一种生产力工具投入到认真的工作中，所以这一次，我们的预测是“全力以赴”。

最后，我们想问：在您看来，2024 年关于人工智能最疯狂的故事是什么？无论您喜欢还是讨厌人工智能，请随时在评论中向我们的列表提出您自己的补充建议。新年快乐！

Benj Edwards 是 Ars Technica 的高级人工智能记者，也是该网站 2022 年人工智能专题的创始人。他也是一位拥有近 20 年经验的科技历史学家。在空闲时间，他创作和录制音乐、收集老式电脑并享受大自然。他住在北卡罗来纳州罗利。

OC