询问技术专家:CPU、GPU 和 TPU 之间有什么区别?

2024-10-30 19:37:50 英文原文

作者:Molly McHugh-Johnson

2024 年 10 月 30 日

[[读取时间]] 分钟读取时间

我们最新的 TPU Trillium 现已推出预览版。从 Google 专家那里了解有关我们最新 TPU Trillium 的更多信息,以及 TPU、CPU 和 GPU 是什么以及它们有何不同。

Three squares illustrate different computer processors. Blue: a classic CPU with a grid of contact points. Green: a GPU with a simple line symbolizing parallel processing. Yellow: a TPU with intricate circuitry for machine learning.

回到五月份的 I/O 大会上,我们宣布了延龄草,我们自己定制设计的第六代芯片,称为张量处理单元 (TPU) – 今天,我们宣布现已向 Google Cloud 客户提供预览版。TPU 为 AI 提供动力,使您的 Google 设备和应用程序尽可能有用,而 Trillium 是迄今为止最强大、最可持续的 TPU。

但TPU到底是什么?是什么让延龄草“定制”?要真正了解 Trillium 的特殊之处,不仅要了解 TPU,还要了解其他类型的计算处理器(CPU 和 GPU)以及它们的不同之处。作为 Google Cloud 人工智能基础设施的产品经理,Chelsie Czop 确切地知道如何分解这一切。“我在多个团队中工作,以确保我们的平台对构建人工智能产品的客户来说尽可能高效,”她说。Chelsie 表示,谷歌的许多人工智能产品之所以成为可能,是因为谷歌的 TPU。

让我们从基础开始吧!什么是 CPU、GPU 和 TPU?

这些都是用作计算任务处理器的芯片。把你的大脑想象成一台计算机,它可以做一些事情,比如读书或做数学题。这些活动中的每一个都类似于计算任务。因此,如果您使用手机拍照、发送短信或打开应用程序,手机的大脑或处理器就会执行这些计算任务。

不同的缩写词代表什么?

尽管 CPU、GPU 和 TPU 都是处理器,但它们越来越专业化。CPU 代表中央处理单元。这些是通用芯片,可以处理各种任务。与您的大脑类似,如果 CPU 不专门负责某些任务,则某些任务可能需要更长的时间。

然后是 GPU,即图形处理单元。GPU 已成为从图形渲染到人工智能工作负载等加速计算任务的主力。它们就是所谓的 ASIC 或专用集成电路。集成电路通常是用硅制成的,因此您可能会听到人们将芯片称为“硅”,它们是同一件事(是的,这就是“硅谷”一词的由来)简而言之,ASIC 是为单一的、特定的目的而设计的。

TPU(即张量处理单元)是 Google 自己的 ASIC。我们从头开始设计 TPU 来运行基于人工智能的计算任务,使其比 CPU 和 GPU 更加专业。TPU 一直是 Google 一些最受欢迎的人工智能服务的核心,包括搜索、YouTube 和 DeepMind 的大型语言模型。

明白了,所有这些芯片都是让我们的设备正常工作的。在哪里可以找到 CPU、GPU 和 TPU?

CPU 和 GPU 存在于您可能每天使用的非常熟悉的物品中:您几乎会在每部智能手机中找到 CPU,而且它们也存在于笔记本电脑等个人计算设备中。您可以在高端游戏系统或某些桌面设备中找到 GPU。您只能在 Google 数据中心找到 TPU:仓库式建筑,里面装满了机架和机架的 TPU,24/7 全天候运转,以保持 Google 和我们的云客户的 AI 服务在全球范围内运行。

是什么让 Google 开始考虑创建 TPU?

CPU 发明于 20 世纪 50 年代末,GPU 出现于 20 世纪 90 年代末。然后在谷歌,大约 10 年前我们开始考虑 TPU。我们的语音识别服务的质量越来越好,我们意识到,如果每个用户每天只与 Google“交谈”三分钟,我们就需要双倍的我们数据中心的计算机数量。我们知道我们需要比当时可用的现成硬件更高效的东西,并且我们知道我们将需要每个芯片具有更多的处理能力。所以,我们建立了自己的!

那“T”代表张量,对吧?为什么?

是的,“张量”是用于机器学习的数据结构的通用名称。基本上,在幕后进行了大量的数学运算,使人工智能任务成为可能。借助我们最新的 TPU Trillium,我们增加了可能发生的计算量:与上一代 TPU v5e 相比,Trillium 每个芯片的峰值计算性能提高了 4.7 倍。

这到底是什么意思?

这基本上意味着 Trillium 能够处理运行复杂数学所需的所有计算,速度比上一个版本快 4.7 倍。Trillium 不仅工作速度更快,还可以处理更大、更复杂的工作负载。

与我们的上一代 TPU 相比,还有什么可以改进的吗?

Trillium 的另一个优点是它是我们迄今为止最具可持续性的 TPU,事实上,它比我们上一款 TPU 的能效高 67%。随着人工智能需求持续飙升,该行业需要可持续地扩展基础设施。Trillium 本质上使用更少的功率来完成相同的工作。

现在客户开始使用它,您认为 Trillium 会产生什么样的影响?

我们已经看到了由 Trillium 提供支持的一些相当令人难以置信的发展!我们的客户将其用于分析各种疾病的 RNA、以令人难以置信的速度将书面文本转换为视频等技术。这只是我们最初一轮用户的情况,现在 Trillium 已处于预览阶段,我们迫不及待地想看看人们可以用它做什么。

关于《询问技术专家:CPU、GPU 和 TPU 之间有什么区别?》的评论


暂无评论

发表评论

摘要

谷歌宣布推出名为 Trillium 的第六代张量处理单元 (TPU),为谷歌云客户提供预览版。Google Cloud 的 AI 基础设施产品经理 Chelsie Czop 解释说,TPU 是专门的芯片,旨在比 CPU 和 GPU 更高效地处理基于 AI 的计算任务。与前身 TPU v5e 相比,Trillium 的峰值计算性能提高了 4.7 倍,能效也提高了 67%,这使其在 AI 工作负载的速度和可持续性方面取得了显着进步。