作者:By James O'Donnellarchive page
当前的人工智能热潮正在消耗大量能源,这已不是什么秘密。现在我们对具体金额有了更好的了解。
哈佛大学 T.H. 团队的一篇新论文Chan 公共卫生学院检查了美国运营的 2,132 个数据中心(占该国所有设施的 78%)。这些设施(本质上是装满了一排服务器的建筑物)是人工智能模型接受训练的地方,每次我们通过 ChatGPT 等模型发送请求时,它们也会被“ping”。它们需要大量的能源来为服务器供电并保持冷却。
自 2018 年以来,美国数据中心的碳排放量增加了两倍。截至 2024 年 8 月的 12 个月中,数据中心排放了 1.05 亿吨二氧化碳2,占全国排放量的2.18%(相比之下,国内商业航空公司的排放量约为1.31亿吨)。美国所有能源消耗中约有 4.59% 用于数据中心,这一数字自 2018 年以来翻了一番。
自 2022 年 11 月 ChatGPT 推出以来,人工智能一直在蓬勃发展,很难具体说明人工智能在多大程度上对这一激增负有责任。这是因为数据中心处理大量不同类型的数据,除了训练或 ping AI 模型之外,它们还执行从托管网站到将照片存储在云中的所有操作。然而,研究人员表示,随着几乎每个经济领域都试图采用该技术,人工智能的份额肯定会迅速增长。
“这是一个相当大的激增,”智囊团能源创新高级研究员埃里克·吉蒙(Eric Gimon)说道,他没有参与这项研究。– 对于这种指数级增长的速度有多快,有很多令人惊叹的分析。但就计算效率或不同类型的芯片而言,该业务仍处于早期阶段。”
值得注意的是,所有这些电力的来源特别“肮脏”。由于许多数据中心位于弗吉尼亚州等产煤地区,因此它们使用的能源的“碳强度”为 48%高于全国平均水平。该论文发表于arXiv尚未经过同行评审,发现美国 95% 的数据中心建在电力来源比全国平均水平更脏的地方。
该论文的作者法尔科·巴尔加利-斯托菲 (Falco Bargagli-Stoffi) 表示,除了位于煤炭国家之外,还有其他原因。“全天都可以使用脏能源,”他说,许多数据中心需要这种能源来维持 24-7 的高峰运行。“风能或太阳能等可再生能源可能不那么可用。”政治或税收激励以及当地的阻力也会影响数据中心的建设地点。
人工智能目前的一个关键转变意味着该领域的排放量很快可能会猛增。人工智能模型正在迅速从 ChatGPT 等相当简单的文本生成器转向高度复杂的图像、视频和音乐生成器。到目前为止,许多“多模式”模型还停留在研究阶段,但这种情况正在发生变化。
OpenAI发布视频生成模型索拉该产品已于 12 月 9 日向公众开放,其网站因渴望测试的人们的流量而大量涌入,导致其仍无法正常运行。谷歌的 Veo 和 Meta 的 Movie Gen 等竞争模型尚未公开发布,但如果这些公司像过去一样追随 OpenAI 的领导,它们可能很快就会公开发布。Suno 和 Udio 的音乐生成模型正在增长(尽管诉讼)和英伟达释放上个月它自己的音频发生器。谷歌正在致力于其阿斯特拉项目,这将是一个视频人工智能伴侣,可以与你实时对话周围的环境。
“当我们扩展到图像和视频时,数据大小呈指数级增长,”该论文的主要作者、比萨大学和 IMT Lucca 的人工智能博士生 Gianluca Guidi 说道。他说,将这一点与更广泛的采用结合起来,排放量很快就会猛增。
研究人员的目标之一是建立一种更可靠的方法来获取数据中心使用能源量的快照。鉴于数据分散在多个来源和机构中,这是一项比您想象的更复杂的任务。他们现在已经建造了一个门户网站这显示了全国数据中心的排放量。数据管道的长期目标是为未来遏制数据中心排放的监管工作提供信息,预计数据中心的排放将在未来几年大幅增长。
哈佛数据科学计划主任、另一位合著者 Francesca Dominici 表示,“具有环境和可持续发展意识的社区与大型科技公司之间的压力将会越来越大。”– 但我的预测是不会有监管。未来四年内不会。”