英语轻松读发新版了,欢迎下载、更新

重新混合内存可以遏制人工智能的能源问题吗?

2024-12-16 18:04:50 英文原文

作者:Katherine Bourzac

存储器的未来是巨大的、多样化的,并且与处理紧密集成。这是一位受邀者的留言本周谈论国际电子器件会议在旧金山。H.-S。黄飞利,斯坦福大学电气工程师,前研究副总裁台积电他仍然是公司的科学顾问,他告诉聚集在一起的工程师,是时候以新的方式思考内存和计算架构了。

当今计算问题(尤其是人工智能)的需求正在迅速超出现有存储系统和架构的能力。今天的软件假设可以随机访问任何给定的内存位。将所有数据在内存和处理器之间来回移动会消耗时间和大量能源。而且并非所有数据都是一样的。其中一些需要经常访问,一些则不经常访问。黄认为,这个“记忆墙”问题需要进行清算。

Wong 表示,不幸的是,工程师们仍然关注这样一个问题:哪种新兴技术将取代当今的传统存储器(包括 SRAM、DRAM 和闪存)。这些技术及其潜在替代品都各有优缺点。有些提供更快的数据读取;其他提供更快的写作。有些更耐用;有些则更耐用。其他的则具有较低的功率要求。Wong 认为,寻找一种新的存储技术来统治所有这些技术是错误的做法。

“你不可能找到完美的记忆,”黄说。

相反,工程师应该查看系统的要求,然后挑选最有效的组件组合。Wong 主张从特定类型的软件用例的需求出发。他说,选择正确的内存技术组合是“一个多维优化问题”。

一种内存无法满足所有需求

试图让一种内存在所有方面都做到最好——快速读取、快速写入、可靠性、保留时间、密度、能源效率等等——会让工程师们“无缘无故地工作得太辛苦”他边说边展示了一张幻灯片,上面是电气工程师西西弗斯推着齿轮上山的画面。– 我们孤立地看待数字,而不知道技术的用途。这些数字可能根本不重要,”他说。

例如,当设计一个需要频繁、可预测地读取内存和不频繁写入的系统时,MRAM、PCM 和 RRAM 是不错的选择。对于传输大量数据的系统,系统需要频繁写入、很少读取,并且只需要很短的数据生命周期。因此,工程师可以权衡保持速度、密度和能耗,并选择增益单元或 FeRAM。

谈到启动核电工厂为人工智能数据中心提供燃料,显然该行业已经意识到其能源问题。

这种灵活性可以带来巨大的好处。作为一个例子,Wong 指出了他的工作混合增益单元,与 DRAM 类似,但每个存储单元中使用两个晶体管,而不是一个晶体管和一个电容器。一个晶体管是硅的,可提供快速读出;另一种是无需刷新即可存储数据,并且基于氧化物半导体。当这些混合增益单元与 RRAM 结合用于 AI/机器学习训练和推理时,与传统存储系统相比,它们可提供 9 倍的能源使用效益。

黄说,最重要的是,这些多样化的记忆需要与计算更紧密地结合。他主张将多个芯片集成到一个“幻觉系统”中,每个芯片都有自己的本地存储器,该系统将每个芯片视为一个更大系统的一部分。在一篇发表的论文中十月Wong 和他的合作者提出了一种计算系统,该系统使用硅 CMOS 芯片作为基础,分层由 STT-MRAM 组成的快速访问密集存储器、用于非易失性存储器的金属氧化物 RRAM 层以及高速、高密度增益细胞。他们称之为 MOSAIC(单片、堆叠和组装 IC)。为了节省能源,数据可以存储在将要处理的位置附近,并且堆栈中的芯片可以在不需要时关闭。

在提问环节,观众中的一位工程师表示,他喜欢这个想法,但指出所有这些不同的部件都是由不同的公司制造的,并且不能一起工作。Wong 回答说,这就是为什么像 IEDM 这样让大家聚集在一起的会议很重要。随着关于启动核电站为人工智能数据中心提供燃料的讨论,很明显该行业已经意识到其能源问题。“需求是发明之母,”他补充道。

关于《重新混合内存可以遏制人工智能的能源问题吗?》的评论


暂无评论

发表评论

摘要

H.-S。斯坦福大学电气工程师 Philip Wong 在旧金山举行的国际电子器件会议上表示,存储器的未来需要转向与处理单元紧密集成的大规模且多样化的系统,以解决当前人工智能需求带来的限制。他反对专注于单一新兴技术来取代现有的存储器层次结构(SRAM、DRAM、闪存),因为它们固有的权衡,而是主张根据特定软件要求进行灵活组合。Wong 提出了一种使用 MOSAIC 等混合和堆叠内存系统的优化集成方法,与传统内存解决方案相比,它具有显着的能效优势。他强调行业合作的必要性,以克服有效实施不同内存架构的挑战。