作者:Eliza Strickland
如果您阅读有关AI的新闻,您可能会感到矛盾的消息轰炸:AI蓬勃发展。人工智能是泡沫。当前的技术和架构将继续产生突破。AI处于不可持续的道路上,需要激进的新想法。人工智能将要找你的工作。AI主要适合将您的家庭照片变成Studio Ghibli风格的动画图像。
削减混乱是2025 AI指数从斯坦福大学大学以人工智能为中心的人工智能。400多页的页面报告塞满了有关研发,技术绩效,负责人AI,经济影响,科学和医学,政策,教育和舆论主题的图形和数据。作为IEEE光谱每年都会看到我们的报道2021,,,,2022,,,,2023, 和2024),我们阅读了整个内容,并摘下了我们认为现在AI的真实故事的图表。
尽管有许多不同的方法可以衡量在AI种族中哪个国家 /地区(日记文章发表或引用,但专利授予等等),一个直接的指标是谁推出了重要的模型。研究学院时期AI有一个数据库有影响力和重要的AI模型从1950年延伸到现在,AI索引从中汲取了此图表中所示的信息。
去年,有40个著名模型来自美国, 尽管中国有15个,欧洲有3个(顺便说一句,全部来自法国)。另一个图表(在此未显示)表明,几乎所有2024款车型都来自行业,而不是学术界或政府。至于著名的下降从2023年发行的模型2024年,指数表明这可能是由于技术的复杂性日益增强和培训的不断增长成本。
Yowee,但这很昂贵!AI指数没有精确的数据,因为许多领先的AI公司已停止发布有关其培训的信息。但是,研究人员与Epoch AI合作,根据培训时间,类型和硬件等等的细节,估算至少某些模型的成本。他们能够估计成本的最昂贵的车型是Google的Gemini 1.0 Ultra,令人叹为观止的成本约为1.92亿美元。培训成本的一般规模与报告的其他发现相吻合:模型还在继续扩大参数计数,培训时间和培训数据量。
此图表中不包括中国的新贵DeepSeek,它在一月份震撼了金融市场,声称培训竞争性的大语言模式,仅为600万美元,声称某些行业专家有争议。AI索引指导委员会联合导演Yolanda Gil告诉IEEE光谱她发现DeepSeek非常令人印象深刻,并指出,计算机科学的历史充满了早期效率低下的技术的例子。她说,我不是唯一一个认为在某个时候会有更有效版本的LLM的人。”我们只是不知道谁会建造它,以及如何建造它。
培训的不断增加的成本(大多数)AI模型可能会掩盖该报告的一些积极趋势:硬件成本降低,硬件性能不断增加,并且能源效率起来了。那意味着我杂音成本或查询训练有素的模型的费用正在急剧下降。该图表的比例比例很大,它显示了每美元的人工智能表现。该报告指出,蓝线从每百万个令牌下降到每百万个代币的0.07美元下降;粉红色线条在不到一年的时间内从15美元下降到0.12美元。
虽然能源效率是一个积极的趋势,但让我们的鞭子回到负面:尽管效率提高,但总体功耗仍在增加,这意味着数据中心在AI繁荣的中心,具有巨大的碳足迹。AI指数估计碳排放基于培训硬件,云提供商和位置等因素的选择AI模型,并发现随着时间的流逝,训练前沿AI模型的碳排放量不断增加,而DeepSeek成为异常值。
此图表中包括的最坏的罪犯,骆驼3.1,估计有8,930吨CO2发射,相当于约496名美国人生活一年的美国人。这种巨大的环境影响解释了为什么AI公司成为拥抱核作为无碳功率的可靠来源。
美国可能仍在释放的许多著名模型上有指挥的领先优势,但是中国模型正在赶上质量。该图显示了聊天机器人基准上的狭窄性能差距。2024年1月美国顶级车型的表现优于最佳中国车型9.26%。到2025年2月,这一差距已缩小到仅1.70%。该报告在与推理,数学和编码有关的其他基准方面发现了类似的结果。
今年的报告强调了一个不可否认的事实,即我们用来衡量AI系统功能的许多基准是饱和的。它发生在许多领域中:一般知识,有关图像,数学,编码等的推理。吉尔(Gil)说,在基准逐渐变得无关紧要之后,她惊讶地看着基准。她说,我一直在想[表现]要达到高原,这将达到我们需要新技术或根本不同的建筑的地步。但是事实并非如此。
鉴于这种情况,坚定的研究人员一直在制定他们希望挑战AI系统的新基准。其中之一是人类的最后考试,其中包括由来自全球500个机构的主题专家提出的极具挑战性的问题。到目前为止,即使是最佳AI系统也很难:Openai的推理模型O1到目前为止的得分最高,有8.8%的正确答案。我们会看到持续多长时间。
今天生成的AI系统通过培训大量数据来获得智能互联网,导致人们经常认为数据是AI经济的新石油。随着AI公司不断推动他们可以向自己的模型提供多少数据的限制,人们开始担心峰值数据,以及我们何时耗尽这些内容。一个问题是网站是越来越限制机器人从爬网站并刮擦数据(也许是因为AI公司正在从网站数据中获利同时杀死其商业模式的问题)。网站在机器可读机器人.txt文件中说明了这些限制。
该图表显示,来自顶级Web域的48%的数据现在受到完全限制。但是吉尔说,AI内的新方法可能会结束对巨大的依赖数据集。她说,我希望在某个时候数据量不会那么重要。”
在过去的五年中,企业界已经打开了AI资金的插头。尽管2024年全球全球投资与2021年的头晕高度不符,但值得注意的是,私人投资从未如此高。在2024年的1500亿美元私人投资中,该指数中的另一幅图表(此处未显示)表示,大约330亿美元用于生成AI的投资。
据推测,公司正在投资AI,因为他们预计投资回报率很高。这是人们以喘息的声音谈论人工智能的变革性质以及生产力前所未有的增长。但是,可以说公司尚未看到一种转变,从而带来了可观的节省或大量的新利润。该图表,来自麦肯锡调查显示,在报告成本降低的公司中,大多数节省的节省不到10%。在由于AI而增加收入的公司中,大多数据报道收益不到5%。这笔巨大的回报可能仍会到来,投资数字表明,许多公司都在押注。只是还不在这里。
科学和医学的AI是AI繁荣的迷你繁荣。该报告列出了各种新的基础模型已发布的目的是帮助领域的研究人员材料科学,,,,天气预报, 和量子计算。许多公司试图将AI的预测和生成力量变成盈利的药物发现。和Openai S O1推理模型最近在名为MEDQA的基准上获得了96%。
但是总的来说,这似乎是另一个巨大潜力的领域,但也没有转化为重大的现实影响力,也许是因为人类仍然没有弄清楚如何使用该技术。该图显示了一项2024年研究的结果,该研究测试了医生是否使用的诊断是否会做出更准确的诊断GPT-4除了它们的典型资源。他们没有,这也不会使它们更快。同时,GPT-4自己的表现就超过了人类团队和人类。
在美国,这张图表显示,国会大厅里有很多关于AI的讨论,而行动很少。该报告指出,美国的行动已转移到州一级,在2024年通过131个法案。深击,禁止他们在选举或用于传播非自愿的亲密图像。
在美国以外,欧洲确实通过了AI行为,这对制造被认为高风险的AI系统的公司施加了新的义务。但是,全球最大的趋势是各国聚集在一起,使人们对AI在世界上应该扮演的角色进行了详尽而无约束力的声明。因此,周围有很多谈话。
无论您是股票摄影师,营销经理还是卡车司机,关于AI是否会出现工作或何时来工作的公众讨论。但是,在最近对AI态度的全球态度调查中,大多数人没有受到AI的威胁。尽管有32个国家的60%的受访者认为AI会改变他们的工作方式,但只有36%的受访者预计将被替换36%。吉尔说,这些调查结果真的让我感到惊讶。思考的是非常有能力,AI将改变我的工作,但我仍然会带来价值。''请继续关注,以了解我们是否都通过管理AI员工的渴望团队来带来价值。