AMD“推进人工智能”活动:9分钟内全部揭晓
好的,欢迎来到2024年AI进展大会。今天我非常激动地推出我们的第五代Epic系列。这一切都始于我们最新的Z5核心。我们设计Zen 5是为了在服务器工作负载中表现最佳。这意味着相比于Zen 4,在IPC性能上平均提高17%,并添加了对完整AVX-512的支持,这太棒了。它最多可以拥有100亿至500亿个晶体管,分布在17个晶粒上,可扩展至多达105和92个核心以及384个线程。第五代Epic系列非常特别的一点是我们从架构角度出发考虑如何构建行业内最广泛的CPU产品组合,以覆盖所有新的云工作负载以及重要的企业工作负载。举个例子,在设计第五代Epic CPU时将其频率提升到5GHz,这是因为在看到需要支持新的工作负载时,频率变得非常重要。这展示了我们在产品线中引入了T系列。这款T版本实际上拥有1028个核心,并针对纵向扩展的工作负载进行了优化。它使用的是164纳米的晶粒,如果你看外面环的一部分,你会看到这些164纳米的晶粒和中心位置的一个XDNA 2 NPU。我非常激动地预览我们的下一代MI350系列。这个系列引入了我们新的CDNA架构。它最多可以拥有288GB的HBM-3E内存,并增加了对新FP4和FP6数据类型的支援。我们在考虑如何最快将这项技术推向市场,同时也可以将其插入与MI 300、MI 325相同的基础设施中,在2025年下半年推出时会带来我们历史上的最大AI性能飞跃。CDNA 4提供的AI计算性能超过了七倍,并且增加了内存容量和带宽。我们实际设计了它以提高效率,减少诸如网络开销等问题,从而可以增加整体系统的性能。总的来说,C DNA 4将会提供比CDNA 3大35倍的AI性能提升。从最新的公开模型到旗舰级专有模型,我们的重点一直在于性能方面,每次更新都带来了显著的性能改进。我们最近发布的Roam 6.2版本在关键任务负载上的表现相比于去年的六点二版本提高了两倍多的性能。这些改进得益于多个增强功能,包括改进的关注算法、图形优化、计算库和框架优化等。同样,Roam 6.2也带来了超过1.8倍的训练性能提升。这些性能提升通过改进关注算法(如Flash Attention V3)、支持更好的计算通信库、并行化策略以及框架优化来实现。AMD Pensando团队现在发布了第三代P4引擎,包括超过200个全功能编程匹配处理单元。这意味着一个超级高性能、完全可编程的数据路径引擎,能够以每秒400Gbps的线路速率性能运行,同时在该引擎上可以并行运行多个高级服务,并且这些服务可以在软件的速度下进行编码和更改,同时保持与硬连线解决方案相同的性能水平。Selena能够在提供SDN安全加密服务的同时达到每秒400Gbps的吞吐量,其性能超过了我们前一代产品的两倍以上,并且完全向后兼容。这种全可编程流水线意味着我们可以持续地为客户提供创新和新功能,同时他们也可以在其基础上添加自己的创新成果。Selena将驱动高性能前端网络用于AI系统,并满足由需要数据喂养的CPU驱动的一般计算云日益增长的需求。同样让我激动的是宣布AMD的Polara 400系列。它使用同样的第三代P4引擎来实现我们预期将成为行业第一个超以太网联盟准备好的AI解决方案,这将提供UEC就绪RDMA的性能优势,并确保AMD客户能够快速创新并达到最快的生产时间。AMD团队在网络方面的表现非常出色,我很高兴地宣布Selena和Polara都将在明年初推出。AMD Ryzen AI Pro 300系列重新定义了商用PC可以实现什么。我们结合了我们的高性能Z5 CPU、新的R DNA 3.5图形卡以及具有超过50TFLOPS AI性能的新XDNA 2 NPU,所有这些都在CoPilot Plus PC中实现。