在一个由两部分组成的系列中, 麻省理工学院新闻探讨生成人工智能对环境的影响。在本文中,我们将探讨为什么这项技术如此耗费资源。第二篇文章将调查专家们正在采取哪些措施来减少 genAI 的碳足迹和其他影响。
围绕潜在好处的兴奋 生成式人工智能从提高工人生产力到推进科学研究,都不容忽视。虽然这项新技术的爆炸性增长使得强大的模型能够在许多行业中快速部署,但这种生成式人工智能(淘金热)对环境的影响仍然难以确定,更不用说减轻了。
训练通常具有数十亿个参数的生成式人工智能模型(例如 OpenAI 的 GPT-4)所需的计算能力可能需要大量电力,这会导致二氧化碳排放量增加和电网压力。
此外,将这些模型部署到现实世界的应用程序中,使数百万人能够在日常生活中使用生成式人工智能,然后微调模型以提高其性能,在模型开发出来很久之后,就会消耗大量的能量。
除了电力需求之外,还需要大量的水来冷却用于训练、部署和微调生成人工智能模型的硬件,这可能会导致市政供水紧张并破坏当地生态系统。生成式人工智能应用数量的增加也刺激了对高性能计算硬件的需求,增加了其制造和运输对环境的间接影响。
– 当我们考虑生成式人工智能对环境的影响时,它不仅仅是您插入计算机时消耗的电力。还有更广泛的后果,这些后果会影响系统级别并根据我们采取的行动持续存在,— 材料科学与工程系教授、麻省理工学院脱碳任务负责人 Elsa A. Olivetti 说道 气候项目。
Olivetti 是 2024 年论文的资深作者,☀生成人工智能对气候和可持续发展的影响,由麻省理工学院的同事共同撰写,以响应全研究所征集论文的呼吁,探索生成式人工智能对社会的积极和消极的变革潜力。
要求苛刻的数据中心
数据中心的电力需求是造成生成式人工智能环境影响的主要因素之一,因为数据中心用于训练和运行 ChatGPT 和 DALL-E 等流行工具背后的深度学习模型。
数据中心是一座温度受控的建筑,其中包含服务器、数据存储驱动器和网络设备等计算基础设施。例如,亚马逊有超过 全球100个数据中心,每个服务器拥有约 50,000 台服务器,该公司用于支持云计算服务。
虽然数据中心自 20 世纪 40 年代以来就已存在(第一个数据中心于 1945 年在宾夕法尼亚大学建成,以支持 第一台通用数字计算机,ENIAC),生成式人工智能的兴起极大地加快了数据中心建设的步伐。
– 生成式人工智能的不同之处在于它所需的功率密度。从根本上说,它只是计算,但生成式人工智能训练集群可能比典型的计算工作负载消耗七到八倍的能量,”该影响论文的主要作者、美国国家科学院计算与气候影响研究员诺曼·巴希尔 (Noman Bashir) 说道。麻省理工学院气候与可持续发展联盟 (MCSC) 和计算机科学与人工智能实验室 (CSAIL) 的博士后。
科学家估计,北美数据中心的电力需求从 2022 年底的 2,688 兆瓦增加到 2023 年底的 5,341 兆瓦,部分原因是生成式人工智能的需求。在全球范围内,数据中心的电力消耗到 2022 年将增至 460 太瓦。据统计,这将使数据中心成为全球第 11 大电力消耗国,位于沙特阿拉伯(371 太瓦)和法国(463 太瓦)之间。经济合作与发展组织。
到 2026 年,数据中心的电力消耗预计将接近 1,050 太瓦(这将使数据中心在全球排行榜上升至第五位,位于日本和俄罗斯之间)。
虽然并非所有数据中心计算都涉及生成式人工智能,但该技术一直是能源需求不断增长的主要驱动力。
– 无法以可持续的方式满足对新数据中心的需求。公司建设新数据中心的速度意味着它们的大部分电力必须来自化石燃料发电厂,”巴希尔说。
训练和部署像 OpenAI 的 GPT-3 这样的模型所需的能力很难确定。在 2021 年的一份研究论文中,谷歌和加州大学伯克利分校的科学家估计,仅训练过程就消耗了 1,287 兆瓦时的电力(足以为约 120 个美国普通家庭供电一年),产生约 552 吨二氧化碳。
巴希尔解释说,虽然所有机器学习模型都必须经过训练,但生成式人工智能特有的一个问题是训练过程的不同阶段发生的能源使用的快速波动。
电网运营商必须有办法吸收这些波动来保护电网,他们通常采用 柴油发电机为了那个任务。
推理的影响不断增加
一旦生成式人工智能模型经过训练,能源需求就不会消失。
每次使用模型时,可能是个人要求 ChatGPT 总结电子邮件,执行这些操作的计算硬件都会消耗能量。研究人员估计,ChatGPT 查询消耗的电量是简单网络搜索的五倍左右。
“但日常用户不会对此考虑太多,”巴希尔说。– 生成式人工智能界面的易用性以及缺乏有关我的行为对环境影响的信息意味着,作为用户,我没有太多动力去减少生成式人工智能的使用。Ø
对于传统人工智能,能源使用在数据处理、模型训练和推理之间相当均匀地分配,推理是使用经过训练的模型对新数据进行预测的过程。然而,Bashir 预计生成式人工智能推理的电力需求最终将占据主导地位,因为这些模型在许多应用中变得无处不在,并且随着未来版本的模型变得更大、更复杂,推理所需的电力将会增加。
此外,由于对新人工智能应用的需求不断增长,生成式人工智能模型的保质期特别短。巴希尔补充道,公司每隔几周就会发布新模型,因此用于训练先前版本的能量就被浪费了。新模型通常会消耗更多的训练能量,因为它们通常比前任模型具有更多的参数。
虽然数据中心的电力需求可能是研究文献中最受关注的,但这些设施消耗的水量也会对环境产生影响。
冷冻水通过吸收计算设备的热量来冷却数据中心。巴希尔表示,据估计,数据中心每消耗一千瓦时的能源,就需要两升水进行冷却。
– 仅仅因为这被称为“云计算”,并不意味着硬件位于云端。数据中心存在于我们的物理世界中,由于它们的用水,它们对生物多样性有直接和间接的影响,”他说。
数据中心内部的计算硬件会带来其自身的、不太直接的环境影响。
虽然很难估计制造 GPU(一种可以处理密集的生成式人工智能工作负载的强大处理器)需要多少功率,但它会比生产更简单的 CPU 所需的功率更多,因为制造过程更加复杂。GPU 的碳足迹因材料和产品运输相关的排放而变得更加复杂。
获取用于制造 GPU 的原材料也会对环境产生影响,这可能涉及肮脏的采矿程序以及使用有毒化学品进行加工。
市场研究公司 TechInsights 估计,三大生产商(NVIDIA、AMD 和英特尔)到 2023 年向数据中心出货的 GPU 数量将达到 385 万个,高于 2022 年的约 267 万个。预计到 2024 年,这一数字将增长更大的百分比。
巴希尔表示,该行业正走在一条不可持续的道路上,但有一些方法可以鼓励负责任地开发支持环境目标的生成式人工智能。
他、好利获得和麻省理工学院的同事认为,这需要全面考虑生成式人工智能的所有环境和社会成本,以及对其感知效益的价值进行详细评估。
– 我们需要一种更加切合实际的方式来系统、全面地理解该领域新发展的影响。由于改进的速度太快,我们还没有机会提高衡量和理解权衡的能力。”Olivetti 说道。