作者:Kelly deVos
在亚利桑那州梅萨东南部,施工人员正在紧张工作位于最先进的数据中心。这个耗资 10 亿美元的设施将于 2026 年投入使用,提供约 250 万平方英尺的处理能力,相当于超过 43 个足球场。元,Facebook 的母公司。
在这个世界里,每条短信、电话和网站点击都会留下虚拟痕迹,所有这些信息都必须存储在某个地方。新的梅萨梅萨数据中心满足了数字信息管理日益增长的需求。人工智能时代的到来,或者说AI,已经加速对更多中心的需求以及提高能源效率的需要。
曹志超,计算机科学与工程系助理教授计算与增强智能学院, 的一部分艾拉·富尔顿工程学院亚利桑那州立大学正在研究数据存储系统的改进,旨在提高梅萨梅萨数据中心等站点的性能、资源管理和可持续性。
曹获得了 2025 年教师早期职业发展 (CAREER) 奖美国国家科学基金会,或 NSF,表彰他在创新数据存储解决方案方面的工作。
在过去 50 年里,数据中心不断发展。多年来,这些设施都是大型银行相同的文件服务器,或超强大的计算机,它们协同工作来完成任务。
“但我们发现,为不同类型的作业和应用程序使用同类服务器可能会浪费资源,有时甚至是不可持续的,”曹说。– 某些类型的数据分析需要大量处理能力,但不需要高性能存储系统。这些系统或数据库需要大量存储空间,但不需要强大的 CPU 或 GPU。
如今,数据中心正在朝着所谓的“分解的模型。存储(CPU 或 GPU 的处理能力)以及内存(或系统中容纳计算机运行所需指令的部分)都分别存在于不同的机器和资源池中。这使得工程师能够利用和配置他们需要的资源,而不是浪费他们不需要的资源。
曹的工作旨在利用这种结构。他正在创建新的、更好的方法来管理针对分类中心量身定制的数据。他的工作特别关注持久键值存储。在此类系统中,数据存储在键值对中。密钥或唯一标识符(例如社会保障或电话号码)用于帮助快速查找记录(称为值)。
数据被设计为持久性的,或者即使断电也能长期保存。
数据中心消耗大量的能源和水。曹的研究希望能够保护这些宝贵的资源。从历史上看,计算机工程师关注的是处理速度,而不太关心功耗。更快总是更好。但并不是每项任务都需要闪电般地快速完成。
“最好开始为新的数据中心架构重新设计现有数据系统,更多地关注性能和可持续性之间的权衡,”曹说。– 我们正在重新设计持久键值存储,以使其更加高效并提供非常精确的控制。当任务需要更多处理或更多存储时,这允许这些存储根据需要扩大或缩小。
他正在与主要合作伙伴建立关系,包括三星、Snowflake、西部数据和 Meta 的专家,以确保正在开发的解决方案满足行业需求。
根据为期五年的资助,曹将培训下一代计算机工程师和科学家,以继续这些前瞻性的发展。
曹项目的一个关键方面是创造研究机会和更高级的课程。他已经更新了计算与增强智能学院当前课程的课程,包括CSE 330 操作系统和CSE 511 大规模数据处理应对新兴趋势。
接下来,曹将扩大旨在为学生创造研究途径的项目。他将把他成功的冬季研究营发展为夏季更长、更全面的活动。2023 年寒假期间,曹带领一个本科生团队完成了一个项目,让他们探索人工智能和持久键值存储之间的关系。该团队的研究成果获得了国际学术会议最佳论文奖第 16 届 ACM 存储和文件系统热点主题研讨会,7 月份在加利福尼亚州圣克拉拉举行的顶级数据会议。
“在夏令营中,较长的时间将使本科生能够与我的博士生一起进行非常扎实的研究,”曹说。“我可以为他们提供更详细的指导,帮助他们真正研究问题。”
对于年轻的学习者,他将与网络安全和可信基金会中心亚利桑那州立大学为 K-12 学生提供机会。
NSF 职业奖为新教师建立自己的研究和教育组合提供支持。到目前为止,所有可用数据都表明曹有一个良好的开端。
除了这个奖项之外,他还获得了核心补助金(小)从计算机与网络系统部NSF 创建更有效的方法来处理非结构化数据,例如图像或视频文件中包含的信息。他继续在顶级研究会议上发表他的作品。
罗斯·马切耶夫斯基计算与增强智能学院院长曹表示,曹正在为富尔顿学校的教育和研究任务做出重要贡献。
“这个奖项既是对智超过去的努力的重要认可,也是对他未来在云计算、大规模人工智能服务和科学计算方面实现重大创新的能力的重要认可,”Maciejewski 说。“许多人将受益于他在工业界和学术界的研究,尤其是我们的学生。”