作者:Katherine Bourzac
存储器的未来是巨大的、多样化的,并且与处理紧密集成。这是一位受邀者的留言本周谈论在国际电子器件会议在旧金山。H.-S。黄飞利,斯坦福大学电气工程师,前研究副总裁台积电他仍然是公司的科学顾问,他告诉聚集在一起的工程师,是时候以新的方式思考内存和计算架构了。
当今计算问题(尤其是人工智能)的需求正在迅速超出现有存储系统和架构的能力。今天的软件假设可以随机访问任何给定的内存位。将所有数据在内存和处理器之间来回移动会消耗时间和大量能源。而且并非所有数据都是一样的。其中一些需要经常访问,一些则不经常访问。黄认为,这个“记忆墙”问题需要进行清算。
Wong 表示,不幸的是,工程师们仍然关注这样一个问题:哪种新兴技术将取代当今的传统存储器(包括 SRAM、DRAM 和闪存)。这些技术及其潜在替代品都各有优缺点。有些提供更快的数据读取;其他提供更快的写作。有些更耐用;有些则更耐用。其他的则具有较低的功率要求。Wong 认为,寻找一种新的存储技术来统治所有这些技术是错误的做法。
“你不可能找到完美的记忆,”黄说。
相反,工程师应该查看系统的要求,然后挑选最有效的组件组合。Wong 主张从特定类型的软件用例的需求出发。他说,选择正确的内存技术组合是“一个多维优化问题”。
试图让一种内存在所有方面都做到最好——快速读取、快速写入、可靠性、保留时间、密度、能源效率等等——会让工程师们“无缘无故地工作得太辛苦”他边说边展示了一张幻灯片,上面是电气工程师西西弗斯推着齿轮上山的画面。– 我们孤立地看待数字,而不知道技术的用途。这些数字可能根本不重要,”他说。
例如,当设计一个需要频繁、可预测地读取内存和不频繁写入的系统时,MRAM、PCM 和 RRAM 是不错的选择。对于传输大量数据的系统,系统需要频繁写入、很少读取,并且只需要很短的数据生命周期。因此,工程师可以权衡保持速度、密度和能耗,并选择增益单元或 FeRAM。
谈到启动核电工厂为人工智能数据中心提供燃料,显然该行业已经意识到其能源问题。
这种灵活性可以带来巨大的好处。作为一个例子,Wong 指出了他的工作混合增益单元,与 DRAM 类似,但每个存储单元中使用两个晶体管,而不是一个晶体管和一个电容器。一个晶体管是硅的,可提供快速读出;另一种是无需刷新即可存储数据,并且基于氧化物半导体。当这些混合增益单元与 RRAM 结合用于 AI/机器学习训练和推理时,与传统存储系统相比,它们可提供 9 倍的能源使用效益。
黄说,最重要的是,这些多样化的记忆需要与计算更紧密地结合。他主张将多个芯片集成到一个“幻觉系统”中,每个芯片都有自己的本地存储器,该系统将每个芯片视为一个更大系统的一部分。在一篇发表的论文中十月Wong 和他的合作者提出了一种计算系统,该系统使用硅 CMOS 芯片作为基础,分层由 STT-MRAM 组成的快速访问密集存储器、用于非易失性存储器的金属氧化物 RRAM 层以及高速、高密度增益细胞。他们称之为 MOSAIC(单片、堆叠和组装 IC)。为了节省能源,数据可以存储在将要处理的位置附近,并且堆栈中的芯片可以在不需要时关闭。
在提问环节,观众中的一位工程师表示,他喜欢这个想法,但指出所有这些不同的部件都是由不同的公司制造的,并且不能一起工作。Wong 回答说,这就是为什么像 IEDM 这样让大家聚集在一起的会议很重要。随着关于启动核电站为人工智能数据中心提供燃料的讨论,很明显该行业已经意识到其能源问题。“需求是发明之母,”他补充道。