今天，超级智能已经到来

人们对于超级人工智能何时到来争论不休。事实上，它已经在这里了。

回到一百年前，流行的“智力”概念可能包括计算速度和记忆力等内容。然后我们发明了计算机，它可以比我们记住和回忆更多的东西，并且计算速度无限快。但我们不想将这些能力称为“智能”，因为我们认识到，尽管它们非常强大，但它们的范围却非常狭窄。因此，我们开始使用“智能”这个词来指代机器仍然无法做到的事情——各种形式的模式匹配、逻辑推理、通过自然语言进行交流等等。

然而，早在人工智能发明之前，计算机就已经参与了前沿研究。四色定理这是一个著名的数学难题，一直困扰着人类，直到 20 世纪 70 年代，一些数学家用电脑证明了这一点。人类发现，只需检查大量案例，即可通过暴力证明该定理。因此，计算机完成了人类无法完成的脑力任务，其结果是科学突破。

在 2020 年代，我们发明了计算机系统，可以完成以前只有人类才能完成的大部分认知任务。他们可以阅读、理解并用人类语言说话。他们可以做数学，这实际上只是一种具有非常正式规则的语言（这意味着它们也可以做理论物理）。他们可以识别书面文本中嵌入的复杂知识模式，并应用这些模式来生成可行的见解。他们可以编写软件，因为软件也只是一种具有形式规则的语言。事实证明，为了完成所有这些工作，所有计算机真正需要的是 A）统计回归以概率地识别模式，以及 B）非常大量的计算能力。

这并不意味着人工智能现在可以做人类能做的一切。它的智力是“参差不齐”的– 人类仍然有一些更擅长的事情。但这也是人类相对于动物的优势。你知道黑猩猩比人类更擅长博弈论并有更好的工作记忆？我的兔子辨别声音的能力比我灵敏得多。如果我们能够与黑猩猩和兔子签订商业合同，我们甚至可能会为这些服务付费。同样，人工智能可能不会取代人类的所有工作。但世界上没有人认为黑猩猩和兔子在一组狭隘的认知任务上的优势意味着人类“并不是真正的聪明”。我们的一般智力也是参差不齐的。

大多数旨在衡量我们是否实现了“AGI”的基准（例如 ARC-AGI 和人类的最后考试）都集中在计算机在 2021 年无法完成的事情上，这些事情在人工智能出现之前为人类提供了不可替代的认知优势，并使我们与计算机具有高度互补性。围绕“AGI”的大部分讨论都是关于人工智能何时会超越人类一切。例如，Metaculus 预测者仍然认为 AGI 是未来：

这可能是一个人最重要的问题经济的立场——即我们是否期望人工智能取代人类工作或增强人类工作。但如果我们谈论的是对地球资源的统治，并且掌控地球生命的命运，我们实际上并不需要人工智能在每项认知任务上都做得更好。尽管人类的短期记忆比黑猩猩差，辨别声音的能力比兔子差，但人类还是从动物手中征服了地球。

事实上，我敢打赌，如果人工智能拥有 A）永久自主权和长期记忆，B）高性能机器人，以及 C）人工智能生产链的端到端自动化，它可以击败人类并控制地球今天。我的想法可能是错的，但如果是这样，我怀疑三四年后我也会错。无论如何，如果我们决定不想将地球的控制权交给外星智能，我们应该考虑限制 A) 完全自主，B) 机器人，和/或 C) 人工智能生产链的完全自动化。1

不过，这偏离了我真正的观点。我真正想说的是，人工智能，就目前的情况而言，已经是超级智能了。原因是人工智能已经可以进行语言、概念和模式识别足够好了，同时还有到 2021 年，我们将能够完成计算机所能完成的所有超人、奇妙、强大的事情。

现在，人工智能可以完成人类无法完成的脑力任务。几分钟后，它就可以读取完整的科学文献，并从该文献中提取许多基本结论和见解。没有人能做到这一点。一个人可以成为一两个复杂学科的专家；人工智能可以成为以下领域的专家全部同时。人需要吃饭、睡觉和休息；人工智能代理可以不知疲倦地证明定理或编写代码。人工智能可以证明定理并编写代码 — 或编写文本段落 —快得多比任何人类。

这些都是超人的认知能力。它们远远超出了即使是最聪明的人也能做到的事情。它们是将 LLM 的大致人类水平的语言能力、模式识别和概念分析与 2022 年之前超人的记忆力、速度和处理能力相结合的结果。

我不想在这里偏离主题，但我认为人工智能有非零的机会从不到 2021 年，人类在大多数事情上都比计算机做得更好。人类似乎有可能只是在某些类型的认知任务上非常专业——从稀疏数据中提取模式，将各种模式综合成“直觉”和“判断”，并用语言传达这些模式——而且我们基本上已经接近了理论上的最大值。那些狭窄的区域。

这可以解释为什么人工智能在过去一年里在数学、编码和预测等方面取得了很大的进步，但为什么基本的聊天机器人界面似乎并没有变得更“智能”。这也可以解释为什么当你和陶哲轩谈论数学时，就像和一个超人交谈一样，但当你和他谈论去哪里吃午饭或哪些电影最好时，他听起来就像是一个相当聪明的普通人。人工智能最终会在数学方面比道更好，因为它是一台计算机，而计算机天生就擅长数学，但在决定去哪里吃午饭或推荐电影方面，它可能永远不会比最有思想、最能言善辩的人类做得更好。这可能根本不是数学上的可能在这类事情上比我们已经做得更好。

事实上，这就是人工智能的本质星际迷航：下一代是我一直以来最喜欢的科幻节目，也是我认为最能预测现代人工智能的节目。该剧有两种类型的 AGI：船上的计算机，它最终通过全息甲板创造出超人的知觉；数据，是一个用来模拟人类智能的机器人。在品味、判断力、直觉和对话能力方面，船上的计算机和数据与人类大致相当。但在数学、科学建模等方面，它们要优越得多。2

人类和人工智能之间的最大区别不是卓越的品味、判断力和直觉，而是计算速度和内存等，这是有道理的。这些都是人类特别不擅长的事情，因为我们小小的有机大脑中的空间非常有限。这是有道理的，人类会进化到专注于我们可以得到最大利用的事物类型——识别和交流嵌入在稀疏数据中的模式。这是有道理的，当我们开始自动化认知任务时，我们首先选择我们最弱的事情，因为这些事情具有最大的边际效益。

换句话说，法学硕士、推理链和智能体的出现可能只是创造超人智能的“最后一英里”事件，填补了人类以前专门用来填补的一个重要空白。人工智能相对于人类大脑的最大边际收益可能始终来自我们在 2022 年之前已经具备的部分——能够在几秒钟内扫描整个文献语料库、以闪电般的速度执行计算以及在工作记忆中保存大量信息。

这意味着，尽管人工智能仍然处于“锯齿状”状态，并且在某些基准上仍然只能与人类相当，但人工智能已经准备好开始突破科学研究的界限。大，大路。

让我们从数学开始，人工智能尤其擅长数学。著名数学家 Paul Erdås做出了大约 1,179 个猜想，其中约 41% 已得到解决。这些被称为 ErdÅs 问题。它们不是数学中最难的问题，也不是最有趣的问题。但它们太难了，以至于没有人费心去解决它们，因此它们代表了新颖的数学。近几个月来，人工智能已经开始解决 ErdÅs 问题– 有时与人类数学家合作，但有时以自动、按钮式的方式：

根据数学家陶哲轩创建的网页，人工智能工具已帮助将大约 100 个 ErdÅs 问题转移到“已解决”栏中自十月以来。这些援助的大部分是一种强化的文献检索，就像索尼最初的成功一样。但在许多情况下，法学硕士将现有的定理拼凑在一起——通常是在与数学家提示者的对话中——形成针对这些利基问题的新的或改进的解决方案。至少在两种情况下，法学硕士甚至能够为从未解决过的问题构建原始且有效的证明，几乎不需要人类的输入。

有些人很快就对这一成就嗤之以鼻，声称埃尔德的问题没什么大不了的。但被公认为世界上最好的数学家的陶哲轩看到了其中的潜力。以下是一些摘录他的采访与大西洋报——Matteo Wong：

特别是在这些埃尔德问题中，有一小部分我们真正想要解决的引人注目的问题，然后还有一长串非常模糊的问题。人工智能非常擅长的是系统地探索这条长尾并解决最简单的问题。但这与人类的风格非常不同。人类不会系统地解决所有 1000 个问题，然后选择 12 个最简单的问题来解决，而这正是人工智能正在做的事情。

这是陶说的最近的一次谈话关于人工智能和数学：

对我来说，这些进步表明存在一种互补的数学方法。传统上，人类会在小组中花费数月的时间来解决难题，我们将继续这样做……但我们现在也可以将人工智能规模化：解决一千个问题并拿起所有容易实现的目标。找出将问题与方法相匹配的所有方法。如果有 20 种不同的技术，将它们全部应用于 1,000 个问题，看看这些方法可以解决哪些问题。这就是今天所具备的能力。

陶明白自动化研究可以帮助解决放牧科学中的问题。人类科学家的数量是有限的，他们的时间也是有限的。他们非常积极地从事自己感兴趣的事情，和/或如果成功就会让他们成名的事情。这导致了一个有趣的版本路灯问题;当关键的稀缺资源是聪明人的注意力和努力时，许多无聊或看似渐进的进步就会被忽视。

在数学领域，人工智能将解决那些无聊、乏味或看似无趣的问题。这是一个电脑– 它不知疲倦，它的内存和处理速度本质上是无限的，而且它不会感到无聊。3这是另一个例子不涉及埃尔德问题的全自动数学突破。并且这是理论物理学的一个例子，人工智能表明可能存在一种物理学家认为不可能发生的粒子相互作用。

解决大量小问题可能听起来像是小事，但事实并非如此。中国的创新体系已经表明，大量的渐进成果如何能够使社会整体技术水平产生巨大差异。有时，这些渐进的结果之一——一些晦涩的定理或方法——会被证明对重大突破或更重要的问题有用。事实上，有时伟大的发现完全是偶然发生的 –没有人知道载体有什么用处当它们第一次被发明时，线性代数最终可以说是有史以来发明的最有用的数学形式。这发生在自然科学中也见证了青霉素、X 射线、胰岛素或放射性的发现。

但这只是人工智能的开始——不是未来的人工智能，而是现有的技术今天– 将加速科学发展。因为人工智能是一台计算机，所以它可以充当不知疲倦、速度惊人、无所不知的研究助手。再次是道：

在接下来的几个月里，我认为我们将有各种混合的人类人工智能贡献……今天有很多我们不喜欢做的非常乏味的数学类型，所以我们寻找聪明的方法来绕过它们。但人工智能会很高兴地完成这些繁琐的计算。当我们将人工智能与人类工作流程相结合时，我们就可以轻松克服这些障碍……我们基本上看到人工智能的使用与我期望初级人类合著者做出的贡献相当，尤其是那些非常乐意做繁重工作并解决许多繁琐案例的人。

这位“自动化研究助理”是每天都变得更加不可思议:

Google DeepMind 揭开了 Gemini Deep Think 的面纱，通过其内部模型“Aletheia”实现了从奥林匹克级数学到现实世界科学突破的飞跃……“Aletheia”自主解决了开放数学问题（包括来自 ErdÅs 数据库的四个问题），为可发表的论文做出了贡献，并帮助解决了算法、经济学、机器学习优化，甚至宇宙弦物理方面的挑战……2.5 年前，聊天机器人甚至无法解决简单的数学问题。
“我们正在见证科学工作流程的根本性转变。随着 Gemini 的发展，它充当了人类智力的“力量倍增器”，处理知识检索和严格验证，使科学家能够专注于概念深度和创造性方向。无论是完善证据、寻找反例，还是连接互不相关的领域，人工智能正在成为科学进步下一章的宝贵合作者。”

这是一篇很长且非常好的帖子数学家丹尼尔·利特 (Daniel Litt) 讲述了人工智能将如何提高其领域的生产力。值得注意的是，他并不认为研究的全面按钮自动化即将到来，而是将人工智能视为生产力的巨大推动者。

然而，数学（以及理论物理和理论经济学等类似数学的领域）仅代表一个研究领域；每个领域都有不同的要求。在其他领域，研究人员正在利用人工智能以各种方式提高他们的能力。这是来自Raza Aliani 的总结谷歌论文总结了其中一些方法：

在一个案例中，人工智能被用作对抗性审查者，发现了已通过人类审查的密码学证明中的严重缺陷。这与“总结此 PDF”的用途截然不同。
该模型链接了来自不同领域的工具（例如，使用几何/测量论中的定理在算法问题上取得进展）。这就是广泛阅读真正重要的地方……
人类仍然会选择问题，检查每一个证据，并决定什么是真正的新内容。该模型的作用是提出想法、发现差距并进行繁重的代数……在某些项目中，他们将 Gemini 插入一个循环，在该循环中它……提出一个数学表达式……编写代码来测试它……读取错误消息，然后……自我修复。（人类只有在有希望的事情出现时才会介入）[.]

我们再次看到，人工智能的纯粹科学推理能力只能达到相当聪明的人类的水平，但其类似计算机的能力——速度、细致性、记忆力等等——使其具有超级智能。

这是 Google做类似的事情在生物学中：

我们与 Ginkgo 合作，将 GPT-5 连接到一个自主实验室，这样它就可以提出实验，大规模运行实验，从结果中学习，并决定下一步要尝试什么。这种闭环使蛋白质生产成本降低了 40%。

奥莱·莱曼指出多么令人难以置信改变游戏规则的是：

40% 的成本降低是惊人的，但仍然有点低估了它…真正的数字是时间压缩…人类研究人员可能会在一个月内测试 20-30 种组合。这个系统每次迭代测试了 6,000 次……（如果你想感受一下的话，这大约是 150 年的传统实验室工作压缩到几周内）……药物发现、材料科学、合成生物学，基本上任何瓶颈是“我们需要尝试数千种方法才能找到有效方法”的领域都被其时间线压垮了……其二阶效应将是疯狂的[。]

这是 Andy Hall 的一篇文章，描述了他如何使用代理 AI 来完成更多工作：

即使人工智能不能独立完成大部分研究过程，它也可以自动完成文献检索、检查结果、撰写论文、创建数据演示等大部分繁重工作。气候科学家 Zeke Hausfather 描述了人工智能加速其工作流程的多种方式：

经济学家约翰·科克伦 (John Cochrane) 正在谈论人工智能现在如何检查他的论文并提出有用的建议并发现错误：

就连陶哲轩在他的一篇论文中发现了一个错误使用人工智能！

这是一个 Google 工具只需按一下按钮，即可生成可供出版的科学插图。这是一个软件包这将量化大型定性数据集的属性——这对于社会科学研究非常有用。这是一篇论文关于人工智能如何提高同行评审的质量。这是加布里埃尔·伦茨 (Gabriel Lenz)描述人工智能如何让写一本数据量大的书变得更快、更容易。

请记住，这些只是现有的人工智能工具今天。超级智能已经到来，这要归功于人工智能将人类水平的推理与计算机的超能力相结合的能力。但人工智能每天都在突飞猛进地进步。它可能很快就会获得超人的推理能力。在数学中，如果没有，我会感到惊讶。但即使不是这样，智能体处理长期任务、综合结果、处理大量多样的数据以及从大量科学文献中提取见解的能力的进步在几年内可能会比现在好得多。

人工智能已经给科学带来了巨大的推动力吗？目前还不清楚。出版物大幅上涨，而使用人工智能的科学家们已经经历过生产力的巨大提升。这个内容很多似乎是低质量的斜坡到目前为止，人工智能生成的内容是否会压倒现有的审核流程仍是一个悬而未决的问题。无良科学家也可以越狱人工智能模型让他们p-hack他们的方式到虚假结果。但几个月后，当然几年后，我认为人工智能已经改变了游戏规则。

很多人都在思考超级智能的风险，并且这些风险是非常真实的– 询问什么好处群岛为什么我们要发明一种能够终结人类文明的技术？我们可能得到什么可以证明这种风险是合理的？

我不知道成本/收益计算在哪里。但我很确定这个问题的第一答案是更好的科学。在人工智能出现之前，科学发现遇到了困难——摘取宇宙中大部分唾手可得的果实意味着想法无法实现。寻找成本越来越高，并且需要人类简单地研究的人力生产规模不够。

现在，由于超级智能的发明和科学生产力的增强，我们将能够突破这堵墙。奇妙的科幻材料、可以做任何我们想做的事情的机器人以及可以治愈任何疾病的疗法仅仅是开始。这个宇宙还有很多东西有待发现，而且由于超级智能，还有更多的东西将会被发现。

我只是希望人类仍然能够看到那个未来。

更新

一群人提出了非常有启发性和有益的评论。玛丽安·凯奇利巴尔写:

我研究了代数和数论，关于数学的部分听起来很正确……证明费马大定理的所有繁重工作都是由安德鲁·怀尔斯完成的，但他的证明最终取决于格哈德·弗雷的观察，即如果 FLT 不成立，则可以构造一条非模椭圆曲线 - 这是连接数学景观中一些遥远岛屿的桥梁。这些桥梁很少见，而且往往非常高效，但首先你必须注意到它们是可以建造的，这就是问题所在。当前的数学是如此庞大，以至于人们专门研究其中的微小子领域，并且对于附近子领域中发生的事情只有非常模糊的（如果有的话）想法。更不用说在遥远的子领域了……人工智能没有这种“我的大脑不够大，无法容纳所有东西”的限制……所以，我们可以从人工智能中期待一些有趣的数学概念。不仅仅是艰苦跋涉。

还有约翰·C.写:

我是一名在人工智能相关领域研究理论物理学的科学家。我目前正在进行一个计算项目几个月，我使用 GPT5.2 对该项目进行了 vivi 编码和分析，并在我的笔记本电脑上运行……我 100% 同意这篇文章。我与 GPT 讨论了科学的本质及其巴尔干化。我问，“概念 X 是否存在于其他学科中？”作为元文献搜索。然后它会说“是的，在字段 A 中它称为 X，在字段 B 中它称为 Y，在字段 C 中它称为 Z...”，然后列出其他 3 个字段。这是令人瞠目结舌的综合行为。在现代科学中，文献是如此之多，相同的想法在不同的领域中被重新发明……浪费的重复。

从一般意义上来说，这是关于知识负担。一个经常被引用的原因随着时间的推移，科学变得越来越不新颖随着知识的增长，人类科学家需要越来越长的时间才能跟上已经完成的所有事情。这是诺贝尔奖获得者为何如此的一种可能解释随着时间的推移而变老4。当谈到跨学科的知识时，我们甚至几乎没有尝试为了解决这个问题——如果你几乎无法跟上固态物理文献的速度，你怎么有时间去阅读等离子体物理文献呢？

人工智能基本上冲破了这堵墙。仅此一项就足以产生大量新发现，可能涉及人类，也可能没有人类。

与此同时，Alexander Kustov 有一篇关于人工智能将如何彻底改变社会科学的好文章，其中包含许多其他帖子的链接：

学术界需要对人工智能觉醒

这篇文章的灵感来自我尊敬的人最近与人工智能相关的写作浪潮：Dan Williams、Tibor Rutar、scott cunningham、Kevin Munger、Hollis Robbins、Claude（是的！）Blattman、Kevin Bryan、Andy Hall、Kelsey Piper、Sean Westwood 等。所以在这里，我将继续写那些令人不安但又必要的镜头的传统……

了解更多

8 小时前 · 10 个赞 · 1 条评论 · 亚历山大·库斯托夫

一些摘录：

蒂博尔·鲁塔最近描述了生成完整的研究论文仅使用人工智能提示，就可以创作出他认为可以在第一四分位期刊上发表的作品。据报道，保罗·诺沃萨德在 2-3 小时内就取得了类似的结果。亚沙·蒙克索赔克劳德可以在两个小时内以最少的反馈写出一篇可发表的政治理论论文。斯科特坎宁安估计现在，手稿创作基本上需要花费大约 100 美元的编辑服务加上克劳德的订阅费用……阿齐兹桑德吉描述构建一个大约 200 行的指令文件，编码他的研究工作流程、判断调用和行为护栏……Chris Blattman 从克劳德·法典怀疑论者在几周内构建整个人工智能工作流程工具包……
亚米尔·贝莱斯自 2022 年以来，Patrick Liu 一直在构建人工智能生成的实验设计；现在可以通过提示在 15 分钟内创建定制的 Qualtrics 实验。Velez 的工作指出了更重要的事情：人工智能不仅加快了现有调查方法的速度，还使全新形式的交互式、自适应调查成为可能，而手动编程的设计是不切实际的。David Yanagizawa-Drott 更进一步，启动了一个项目利用 AI 生成 1,000 篇经济学论文——不是作为噱头，而是作为对当研究成本降至接近于零时会发生什么的压力测试。

许多社会科学存在于纯数据领域——统计分析和理论——而不是混乱的物理世界。因此，社会科学可能会像数学或理论物理学一样发生彻底的革命。然而，正如库斯托夫指出的那样，这里真正的挑战是过滤大量的论文和结果，这些论文和结果将来自每个人只是振动编码的研究论文。社会科学已经做得不好，让人怀疑该领域的许多研究只是无用的信号（或更糟）。

当随机的无名作者每月从全球各个角落散布出数十篇看似高质量的论文时，研究领域会是什么样子？AI过滤和AI生成之间会发生军备竞赛吗？在什么时候，整个事情才会变得端到端自动化，人类只需向人工智能询问有关世界的问题，就像神谕一样，并收到通常是正确的但难以确定的答案？

科学将变得更加强大，但在与物理实验没有联系并且（最终）没有人类参与的领域，科学将变得非常强大奇怪的。

OC

今天，超级智能已经到来

关于《今天，超级智能已经到来》的评论

发表评论

摘要

相关新闻

相关讨论