继上个月发布霄龙 9005系列处理器上,AMD 发布了 BIOS 和工作负载调优指南,为运行新 EPYC Turin 服务器的用户提供了直接的设置建议,以优化数据库和 Java 到 HPC 和 AI/ML 软件等不同工作负载的性能。最近,我开始运行一些基准测试来了解 AMD 推荐的 BIOS 调整的影响,并通过查看第五代 AMD EPYC 服务器上一系列 AI/机器学习工作负载的性能(和功耗)影响来开始比较。
AMD EPYC 9005 BIOS 和工作负载调整指南旨在帮助那些出于特定目的部署新 EPYC Turin 服务器的用户,以满足其目标工作负载的平台需求。本指南不是关于任何手动优化代码、操作系统优化或其他调整,而是重点介绍根据您的目标工作负载进行 BIOS 选项调整。
有兴趣的人可以在以下网址找到 AMD EPYC 9005 BIOS 和工作负载调整指南:AMD.com。AMD 的建议包括针对不同工作负载的最佳 CPU/电源设置、NUMA 和内存设置、Infinity Fabric 行为,还涵盖 I/O 和虚拟化设置以及其他 BIOS 可调参数。
这份适用于 EPYC Turin 的 AMD BIOS 调整指南非常简单,并且针对不同的工作负载进行了很好的划分。因此,我认为在 Phoronix 上进行一些有趣的基准测试来比较默认 BIOS 与 AMD 调整建议的差异会很有趣。在本文中,我首先介绍了默认 BIOS 配置下的各种人工智能 (AI) 和机器学习 (ML) Linux 基准测试以及 AI/ML 调整建议。
为了使其代表最终用户体验,我没有使用 AMD 参考服务器平台,而是使用了最近组装的超微 H13SSL-N支持 EPYC 9005 系列的 Socket SP5 主板。96核霄龙 9655处理器与该 1P Supermicro 服务器平台一起使用来进行 BIOS 调整比较。
采用 EPYC 9655 的 Supermicro H13SSL-N 使用 12 x 64GB Micron DDR5-6000 MTC40F2046S1RC64BDY 内存、3.2TB Micron 7450 MTFDKCB3T2TFS NVMe SSD 进行了测试,并运行 Ubuntu 24.10 和 GCC 14.2 的最新软件堆栈,并手动升级到Linux6.12 内核。在所有测试中都使用了 acpi-cpufreq 性能调节器。此测试运行之间的唯一变化是在此 Supermicro EPYC 主板上使用库存/默认 BIOS 设置运行,然后在为 AI/ML 工作负载应用所有推荐的 AMD BIOS 选项后重复测试。