2025 年人工智能炒作大调整
作者:by Will Douglas Heaven archive page
一些幻灭是不可避免的。当 OpenAI 发布名为 ChatGPT 的免费网络应用程序2022 年底,它改变了整个行业以及多个世界经济体的进程。数百万人开始与他们的计算机交谈,而他们的计算机也开始回应。我们很着迷,也期待更多。
我们明白了。科技公司争先恐后地保持领先地位,推出了每一个新版本的竞争对手产品:语音、图像、视频。凭借不间断的优势,人工智能公司将每一款新产品都视为重大突破,强化了人们对这项技术会不断进步的普遍信念。支持者告诉我们进步是指数级的。他们发布了图表绘制自去年模型以来我们已经走了多远:看看这条线是如何上升的!生成式人工智能似乎可以做任何事情。
首先,顶级人工智能公司的负责人做出了他们无法兑现的承诺。他们告诉我们,生成式人工智能将取代白领劳动力,带来富裕的时代,做出科学发现,并帮助寻找新的疾病治疗方法。全球经济体(至少在北半球国家)的“错失恐惧症”(FOMO)使得首席执行官们撕毁了他们的策略并试图采取行动。
就在那时,光芒开始消失。尽管这项技术可能被宣传为一种通用的多功能工具,可以改造过时的业务流程并削减成本,但今年发表的许多研究表明,企业未能让人工智能精灵粉尘发挥其魔力。来自包括美国人口普查局和斯坦福大学在内的一系列来源的调查和追踪发现,企业人工智能工具的使用陷入停滞。当这些工具得到试用后,许多项目停留在试点阶段。如果没有整个经济领域的广泛支持,大型人工智能公司将如何收回他们在这场竞赛中已经花费的巨额资金尚不清楚。
与此同时,核心技术的更新也不再是以前那样的阶梯式变化。
最引人注目的例子是 8 月份 GPT-5 的失败发布。OpenAI 就是这家公司,它点燃了(并在很大程度上维持了)当前的繁荣,并将发布新一代技术。OpenAI 几个月来一直在大肆宣传 GPT-5:“任何领域的博士级专家,”首席执行官 Sam Altman 夸赞道。在另一个场合,奥特曼发布了一张死星的图像,但没有发表评论星球大战,OpenAI 将其视为终极力量的象征:即将推出!人们的期望很高。
然而,当它落地时,GPT-5 似乎——更像是一样?接下来是自三年前 ChatGPT 首次出现以来最大的氛围转变。“突破界限的进步时代已经结束”,人工智能研究员兼热门 YouTuber Yannic Kilcher,在视频中宣布GPT-5 发布两天后发布:“AGI 不会到来。”我们似乎正处于法学硕士的三星 Galaxy 时代。”
很多人(包括我)都用手机做类比。大约十年来,智能手机是世界上最令人兴奋的消费技术。如今,苹果或三星的新产品几乎没有大张旗鼓地发布。虽然超级粉丝们对小升级很感兴趣,但对大多数人来说,今年的 iPhone 现在的外观和感觉与去年的 iPhone 非常相似。这就是生成式人工智能的现状吗?这是一个问题吗?当然,智能手机已经成为新常态。但他们也改变了世界的运作方式。
需要明确的是,过去几年充满了真正的“哇”时刻,来自质量的惊人飞跃视频生成模型所谓推理模型的问题解决能力世界级比赛获胜的最新编码和数学模型。但这项非凡的技术只有几年的历史,而且在很多方面都还不够成熟。仍处于实验阶段。它的成功来自于大警告。
也许我们需要重新调整我们的期望。
大重置
让我们小心一点:从炒作到反炒作的钟摆可能会摆动得太远。仅仅因为这项技术已经被超卖而否定它是轻率的。当人工智能未能达到其宣传的效果时,人们下意识的反应就是说进展已经碰壁了。但这误解了科技研究和创新的运作方式。进步总是断断续续的。墙的上方、周围和下方都有出路。
回顾一下 GPT-5 的发布。OpenAI 在前几个月推出了一系列出色的模型,其中包括 o1 和 o3(同类首个推理模型,为行业引入了全新范式)以及再次提高了视频生成标准的 Sora 2,随后该模型就受到了热烈欢迎。对我来说,这听起来不像是碰壁。
AI确实不错!看看 Nano Banana Pro,这是 Google DeepMind 推出的新图像生成模型,可以将书籍章节转变为信息图等等。它就在您的手机上,免费。
然而,您不禁想知道:当令人惊叹的因素消失后,还剩下什么?一五年后我们将如何看待这项技术?我们会认为值得吗巨大的成本,金融和环境方面?
考虑到这一点,可以通过以下四种方式来思考 2025 年底人工智能的状况: 急需的炒作修正的开始。
01:LLM 并不是一切
在某些方面,需要纠正的是围绕大型语言模型的炒作,而不是整个人工智能。很明显,法学硕士并不是通向大学的大门。通用人工智能,或AGI,一种假设的技术,一些人坚持认为有一天能够完成人类可以完成的任何(认知)任务。
即使是像 Ilya Sutskever 这样的 AGI 传播者,AI 初创公司 Safe Superintelligence 的首席科学家和联合创始人,以及 OpenAI 的前首席科学家和联合创始人,现在也强调了法学硕士的局限性,而法学硕士是他拥有的一项技术。巨大的创造之手。Sutskever 在一份报告中表示,法学硕士非常擅长学习如何完成许多具体任务,但他们似乎没有学习这些任务背后的原则。德瓦克什·帕特尔访谈十一月。
这就是学习如何解决一千个不同的代数问题和学习如何解决任何代数问题。“我认为最根本的是,这些模型的概括能力在某种程度上比人类差得多,”苏茨克弗说。
很容易想象法学硕士可以做任何事情,因为他们对语言的使用是如此引人注目。令人惊讶的是,这项技术能够很好地模仿人们的书写和说话方式。我们天生就会在以某种方式表现的事物中看到智慧——无论它是否存在。换句话说,我们建造了具有类人行为的机器,并且无法抗拒在它们背后看到类人的思想。
这是可以理解的。法学硕士成为主流生活的一部分只有几年时间。但在那段时间,营销人员利用了我们对这项技术真正作用的不稳定认识,提高了期望并加大了炒作。随着我们与这项技术一起生活并更好地理解它,这些期望应该回归现实。
02:人工智能并不能快速解决所有问题
7 月,麻省理工学院的研究人员发表了学习这成为了幻灭阵营中的一个热门话题。最重要的结果是,高达 95% 尝试使用人工智能的企业发现其价值为零。
这一主张的总体主旨也得到了其他研究的呼应。11 月,一个学习Upwork(一家为自由职业者运营在线市场的公司)的研究人员发现,由来自 OpenAI、Google DeepMind 和 Anthropic 的顶级法学硕士支持的代理无法独自完成许多简单的工作场所任务。
这与 Altman 的预测相差甚远:“我们相信,到 2025 年,我们可能会看到第一批人工智能代理“加入劳动力队伍”,并实质性地改变公司的产出,”他在他的个人博客上写道一月。
但麻省理工学院的这项研究忽略了研究人员对成功的衡量标准相当狭窄。95% 的失败率是因为那些试图实施定制人工智能系统但在六个月后尚未将其扩展到试点阶段的公司。许多实验技术的实验没有立即取得成功,这并不奇怪。
该数字还不包括官方飞行员以外的员工使用法学硕士的情况。麻省理工学院的研究人员发现,他们调查的大约 90% 的公司都存在一种人工智能影子经济,员工使用个人聊天机器人帐户。但影子经济的价值并没有被衡量。
当 Upwork 研究观察代理人与知道自己在做什么的人一起完成任务的情况时,成功率大幅上升。结论似乎是,很多人正在自己弄清楚人工智能如何帮助他们完成工作。
这与 AI 研究人员和影响者(以及“vibe 编码”一词的创造者)Andrej Karpathy 的观点相符。注意到:聊天机器人在很多不同的方面都比普通人更好(比如提供法律建议、修复错误、做高中数学),但它们并不比专家更好。卡帕蒂认为,这可能就是为什么聊天机器人受到个人消费者的欢迎,帮助非专家解决日常问题和任务,但它们并没有颠覆经济,因为经济需要在工作中表现优于熟练员工。
这可能会改变。目前,人工智能尚未像支持者所说的那样对就业产生影响,这一点不要感到惊讶。人工智能不是一个快速解决方案,它无法取代人类。但还有很多值得玩的地方。将人工智能集成到日常工作流程和业务管道中的方式仍在尝试中。
03:我们处于泡沫之中吗?(如果有,什么样的泡沫?)
如果人工智能是泡沫,那么它是否像2008年的次贷泡沫或2000年的互联网泡沫?因为差异很大。
次贷泡沫摧毁了经济的很大一部分,因为当泡沫破裂时,除了债务和估值过高的房地产之外,什么也没有留下。互联网泡沫消灭了许多公司,在全世界范围内引发了涟漪,但它留下了刚刚起步的互联网——一个国际电缆网络和谷歌和亚马逊等少数初创公司,这些公司后来成为当今的科技巨头。
话又说回来,也许我们正处于一个与这两者不同的泡沫之中。毕竟,目前法学硕士还没有真正的商业模式。我们还不知道杀手级应用是什么,也不知道是否会有。
许多经济学家担心,前所未有的大量资金被投入到建设能力和满足预计需求所需的基础设施中。但如果这一需求没有实现怎么办?再加上其中许多交易的奇怪循环性——Nvidia 向 OpenAI 付款,再向 Nvidia 付款,等等——每个人对即将发生的事情都有不同的看法,这并不奇怪。
一些投资者仍然乐观。在一个采访与技术商业编程网络大型国际私募股权公司 Silver Lake Partners 的联合创始人格伦·哈钦斯 (Glenn Huchins) 在 11 月份的播客中给出了一些不必担心的理由。“这些数据中心中的每一个(几乎所有)都有一个有偿付能力的交易对手,该交易对手签订合同来获取它们所建造的所有输出,”他说。换句话说,这并不是“构建它,他们就会来”的情况,客户已经被锁定。
他指出,最大的有偿付能力的交易对手之一是微软。“微软拥有世界上最好的信用评级,”哈钦斯说。– 如果您与 Microsoft 签署协议以获取数据中心的输出,那么 Satya 非常适合。”
许多首席执行官将回顾互联网泡沫并试图吸取教训。一种看待方式是:当时破产的公司没有足够的资金来维持这段距离。那些在崩溃中幸存下来的人蓬勃发展。
牢记这一教训,今天的人工智能公司正试图通过可能会或可能不会泡沫的情况来支付费用。留在比赛中;不要落后。即便如此,这也是一场孤注一掷的赌博。
但还有另一个教训。看起来像杂耍的公司可以很快变成独角兽。采取综合,为企业提供头像生成工具。风险投资公司 Air Street Capital 的联合创始人 Nathan Benaich 承认,几年前,当他第一次听说这家公司时,当时对深度造假的恐惧盛行,他不确定该技术的用途,并认为它没有市场。
“我们不知道谁会为口型同步和声音克隆付费,”他说。“事实证明,有很多人愿意为此付费。”Synthesia 目前拥有约 55,000 名企业客户,每年带来约 1.5 亿美元的收入。10月份,该公司估值达到40亿美元。
04:ChatGPT 不是开始,也不会是结束
ChatGPT 是十年进步的顶峰深度学习是所有现代人工智能的基础技术。深度学习本身的种子是在 20 世纪 80 年代播下的。整个领域至少可以追溯到 20 世纪 50 年代。如果在这种背景下衡量进展,生成式人工智能几乎还没有起步。
与此同时,研究工作正处于白热化阶段。向世界主要人工智能会议提交的高质量论文比以往任何时候都多。今年,其中一些会议的组织者拒绝了审稿人已经批准的论文,只是为了控制数量。(同时,像 arXiv 这样的预印本服务器已经充斥着人工智能生成的研究垃圾.)
“又回到了研究时代,”Sutskever 在 Dwarkesh 采访中谈到目前法学硕士的瓶颈时说道。这并不是一次挫折;而是一次挫折。这是新事物的开始。
“总是有很多炒作的野兽,”贝奈奇说。但他认为这样做有一个好处:炒作可以吸引取得真正进步所需的资金和人才。“你知道,就在两三年前,构建这些模型的人基本上都是研究呆子,只是碰巧发现了一些可行的东西,”他说。“现在,每个擅长技术领域的人都在致力于此。”
我们该去哪里?
持续不断的炒作并非仅仅来自于为其昂贵的新技术招揽业务的公司。行业内外都有一大群人希望相信机器能够读、写、写的前景。认为。这是一个几十年前的疯狂梦想. . .
但这种炒作从来都无法持续——这是一件好事。我们现在有机会重新设定期望,了解这项技术的真实面目——评估其真正的功能,了解其缺陷,并花时间学习如何以有价值(且有益)的方式应用它。“我们仍在试图弄清楚如何从这个极其高维的信息和技能黑匣子中调用某些行为,”贝奈奇说。
这种炒作修正早就该发生了。但要知道人工智能不会消失。我们甚至还没有完全了解我们迄今为止所构建的内容,更不用说接下来将要构建的内容了。