英语轻松读发新版了,欢迎下载、更新

通用光子人工智能加速

2025-04-09 15:21:48 英文原文

作者:Harris, Nicholas C.

数据可用性

本研究中介绍的数据集和分析程序可在https://github.com/lightmatter-ai/upaia-paper-2025。参考

Lecun,Y.,Bengio,Y。和Hinton,G。深度学习。

  1. 自然521 ,436 - 444(2015)。文章

    一个 广告一个 CAS一个 PubMed一个 Google Scholar一个 Krizhevsky,A.,Sutskever,I。&Hinton,G。E. Imagenet分类,具有深卷积神经网络。社区。

  2. ACM60 ,84 - 90(2017)。文章

    一个 Google Scholar一个 He,K.,Zhang,X.,Ren,S。&Sun,J。InProc。

  3. 2016 IEEE计算机视觉和模式识别会议(CVPR)770â778(IEEE,2016年)。Vinyals,O。等。

  4. Starcraft II的大师级使用多代理强化学习。自然 575,350 354(2019)。

    文章一个 广告一个 CAS一个 PubMed一个 Google Scholar一个 

  5. Shen,Y。等。具有连贯的纳米光子电路的深度学习。纳特。光子学 11,441 446(2017)。

    文章一个 广告一个 CAS一个 Google Scholar一个 

  6. Lin,X。等。使用衍射深神经网络的全光学机器学习。科学 361,1004 A 1008(2018)。

    文章一个 广告一个 MathScinet一个 CAS一个 PubMed一个 Google Scholar一个 

  7. Hamerly,R.,Bernstei,L.,Sludds,A.,SoljaäIä,M。&Englund,D。基于光电乘法的大规模光学神经网络。物理。修订版X 9,021032(2019)。

    CAS一个 Google Scholar一个 

  8. Feldmann,J。等。使用集成光子张量芯的平行卷积处理。自然 589,52 - 58(2021)。

    文章一个 广告一个 CAS一个 PubMed一个 Google Scholar一个 

  9. Dong,B。等。部分连贯性增强了并行化的光子计算。自然 632,55 -62(2024)。

    文章一个 CAS一个 PubMed一个 PubMed Central一个 Google Scholar一个 

  10. Dong,B。等。使用带有连续时间数据的光子张量核心的高维处理。纳特。光子学 17,1080年1088(2023)。

    文章一个 广告一个 CAS一个 Google Scholar一个 

  11. 贝克尔(S.纳特。社区。 15,3020(2024)。

    文章一个 广告一个 CAS一个 PubMed一个 PubMed Central一个 Google Scholar一个 

  12. Chen,Z。等。具有连贯的VCSER神经网络的深度学习。纳特。光子学 17,723 - 730(2023)。

    文章一个 广告一个 CAS一个 Google Scholar一个 

  13. Wang,T。等。每个乘法使用少于1个光子的光学神经网络。纳特。社区。 13,123(2022)。

    文章一个 广告一个 CAS一个 PubMed一个 PubMed Central一个 Google Scholar一个 

  14. Sludds,A。等。在互联网的边缘上的DeLailocal Photonic深度学习。科学 378,270 276(2022)。

    文章一个 广告一个 CAS一个 PubMed一个 Google Scholar一个 

  15. Shalf,J。摩尔法律以外的计算机未来。哲学反式。R. Soc。数学。物理。工程。科学。 378,20190061(2020)。

    文章一个 广告一个 MathScinet一个 Google Scholar一个 

  16. Schwierz,F。&Liou,J。J. inProc。2020 IEEE拉丁美洲电子设备会议(LAEDC)1â4(IEEE,2020)。

  17. Leeserson,C。E.等。顶部有足够的空间:在摩尔法律之后,什么会推动计算机性能?科学 368,EAAM9744(2020)。

    文章一个 CAS一个 PubMed一个 Google Scholar一个 

  18. Moore,G。E.将更多的组件塞入集成电路上。Proc。IEEE 86,82â85(1998)。

    文章一个 Google Scholar一个 

  19. Waldrop,M。M.筹码降低了摩尔法律。自然 530,144 A47(2016)。

    文章一个 广告一个 CAS一个 PubMed一个 Google Scholar一个 

  20. Vaswani,A。等。在Proc。神经信息处理系统的进步30(Eds Guyon等。)5998年6008(Curran Associates,2017年)。

  21. Devlin,J.,Chang,M.-W.,Lee,K。&Toutanova,K。inProc。2019年北美分会会议计算语言学协会:人类语言技术,第1卷(长篇小说)(Eds Burstein,J。,Doran,C。&Solorio,T。)4171 4186(计算语言学协会,2019年)。

  22. Mnih,V。等。通过深入的强化学习来控制人类水平的控制。自然 518,529 - 533(2015)。

    文章一个 广告一个 CAS一个 PubMed一个 Google Scholar一个 

  23. Jouppi,N。P.等。在Proc。第44届年度国际计算机建筑研讨会(ISCA 17)1 -12(ACM,2017年)。

  24. Peng,B.,Hua,S.,Su,Z.,Xu,Y。&Shen,Y。InProc。2022 IEEE光子学会议(IPC)(IEEE,2022)。

  25. Youngblood,N。用于大规模基质矩阵乘法的相干光子横梁阵列。IEEE J. SEL。顶部。量子电子。 29,1 11(2023)。

    文章一个 Google Scholar一个 

  26. Zhang,H。等。用于实施复杂值神经网络的光学神经芯片。纳特。社区。 12,457(2021)。

    文章一个 广告一个 CAS一个 PubMed一个 PubMed Central一个 Google Scholar一个 

  27. Wetzstein,G。等。用深度光学和光子学的人工智能推断。自然 588,39 - 47(2020)。

    文章一个 广告一个 CAS一个 PubMed一个 Google Scholar一个 

  28. Demirkiran,C。等。一种用于加速深层神经网络的电体系统。ACM J. Emerg。技术。计算。系统。 19,1 31(2023)。

    文章一个 Google Scholar一个 

  29. Pintus,P。等。具有超高耐力的积分非转录磁磁磁性磁体用于光子内存计算。纳特。光子学 19,54 - 62(2025)。

    文章一个 CAS一个 Google Scholar一个 

  30. Shastri,B。J。等。人工智能和神经形态计算的光子学。纳特。光子学 15,102â114(2021)。

    文章一个 广告一个 CAS一个 Google Scholar一个 

  31. Xu,X。等。11顶部用于光学神经网络的光子卷积加速器。自然 589,44 -51(2021)。

    文章一个 广告一个 CAS一个 PubMed一个 Google Scholar一个 

  32. 雅各布,B。等。在Proc。2018 IEEE/CVF计算机视觉和模式识别会议2704 2713(IEEE,2018年)。

  33. Courbariaux,M.,Bengio,Y。&David,J.-P。训练具有低精度乘法的深度神经网络。预印本https://arxiv.org/abs/1412.7024(2015)。

  34. Kirtas,M。等。光子神经网络的混合精液量化培训。神经计算。应用。 35,21361 21379(2023)。

    文章一个 Google Scholar一个 

  35. Basumallik,A。等。自适应块浮点,用于模拟深度学习硬件。预印本https://arxiv.org/abs/2205.06287(2022)。

  36. Giewont,K。等。300毫米整体硅光子铸造技术。IEEE J. SEL。顶部。量子电子。 25,1 11(2019)。

    文章一个 Google Scholar一个 

  37. Ghafarian,H。等。9位,45兆瓦,0.05毫米2源序列终止的DAC驱动器与22 nm CMO中的ECHO CANCELLER进行车载通信。IEEE固态电路。 4,10 13(2021)。

    文章一个 Google Scholar一个 

  38. Yu,K。等。在Proc。2015 IEEE国际固态电路会议 - (ESSCC)技术论文的文摘 https://doi.org/10.1109/isscc.2015.7063098(IEEE,2015年)。

  39. McCreary,J。L.&Gray,P。R. All-Mos电荷重新分布类似物到数字转换技术。我。IEEE J.固态电路 10,371 379(1975)。

    文章一个 广告一个 Google Scholar一个 

  40. Jang,M。等。节能类似于数字转换器的设计技术。IEEE OPEN J.固态电路Soc。 3,145â161(2023)。

    文章一个 Google Scholar一个 

  41. Ramkaj,A。T.等。5-gs/s 158.6兆瓦9.4-Enob被动抽样的时间间隔三阶段的管道式萨尔ADC,在28 nm CMOS中具有模拟数字校正。IEEE J.固态电路 55,1553年1564年(2020年)。

    Google Scholar一个 

  42. Lagos,J。等。10.1-Enob,6.2-FJ/Conv.-Step,500 ms/s,基于RINGAMP的管道式SAR ADC,具有背景校准和16 nm CMOS的动态参考调节。IEEE J.固态电路 57,1112â1124(2022)。

    文章一个 广告一个 Google Scholar一个 

  43. De Lima,T。F.等。光子调节剂神经元的噪声分析。IEEE J. SEL。顶部。量子电子。 26,1 9(2020)。

    文章一个 Google Scholar一个 

  44. Karpathy,A。Nanogpt。github https://github.com/karpathy/nanogpt(2023)。

  45. Wang,C。等。在CMOS兼容电压下运行的综合锂二甲酸锂电气调节器。自然 562,101 104(2018)。

    文章一个 广告一个 CAS一个 PubMed一个 Google Scholar一个 

  46. Abel,S。等。集成在硅上的微型和纳米结构的钛酸钡中的大pockels效应。纳特。母校。 18,42 - 47(2019)。

    文章一个 广告一个 CAS一个 PubMed一个 Google Scholar一个 

  47. Youngblood,N.,Chen,C.,Koester,S。J.&Li,M。波导积聚的黑磷光电探测器,具有高响应性和低暗电流。纳特。光子学 9,247â252(2015)。

    文章一个 广告一个 CAS一个 Google Scholar一个 

  48. Parkhi,O。M.,Vedaldi,A.,Zisserman,A。&Jawahar,C。V. inProc。2012年IEEE计算机视觉和模式识别会议3498 3505(IEEE,2012年)。

下载参考

致谢

我们要感谢K. C. Buckenmaier,M。Gould,C。Ramey,B。Dobbie,S。McKenzie,O。Yildirim,J。Talmage和M. Todd对光子处理器的开发做出了早期贡献。我们还要感谢C. McCarter,N。Dronen,M。Forsythe,T。Lazovich,L。Levkova,D。Walter和D. Widemann的开发和实施ABFP格式。另外,我们感谢C. Chan,P。Clark,S。Cyphers,L。Huang,E。Hein,A。Hussein,S。Iyer,T。Kenney,S。Lines,A。Romano,T。Sarvey和Y. Sanders对软件框架开发的早期贡献。

作者信息

作者和隶属关系

  1. Lightmatter,美国加利福尼亚州山景城

    Sufi R. Ahmed,Reza Baghdadi,Mikhail Bernadskiy,Nate Bowman,Nate Bowman,ryan Braid,Jim Carr,'Elmhurst,布莱斯·加德纳(Bryce Gardiner),艾略特·格林瓦尔德(Elliot Greenwald)帕特尔(Rutayan Patro),罗布·佩洛夫斯基(Rob Pellowski)Zelman,Ritesh Jain,Ayon Basumallik,dariusBunandarâ&nicholas C. Harris

  2. 美国加利福尼亚州旧金山Openai

    理查德·何

贡献

S.R.A.,R.Ba,N.B.,R.Br.,J.Co,C.C.,P.C.,J.Ca.,K.D.,C.D.,C.D.,J.E.,B.G.,E.G.,E.G.,S.G.,R.H.和N.C.H.有助于光子处理器硬件的设计和开发。硕士和H.J.L.为光子处理器的软件堆栈设计和开发做出了贡献。所有作者都为手稿做出了贡献。

相应的作者

对应Ayon Basumallik,,,,达里乌斯·邦达达(Darius Bunandar)或者尼古拉斯·哈里斯(Nicholas C. Harris)。道德声明

竞争利益

作者没有宣称没有竞争利益。

同行评审

同行评审信息

自然

感谢Anthony Rizzo和其他匿名评论者对这项工作的同行评审的贡献。附加信息

出版商的注释

关于已发表的地图和机构隶属关系中的管辖权主张,Springer自然仍然是中立的。补充信息

权利和权限

关于这篇文章

Check for updates. Verify currency and authenticity via CrossMark

引用本文

Ahmed,S.R.,Baghdadi,R.,Bernadskiy,M。等。通用光子人工智能加速度。自然 640,368 374(2025)。https://doi.org/10.1038/s41586-025-08854-x

下载引用

  • 已收到

  • 公认

  • 出版

  • 签发日期

  • doihttps://doi.org/10.1038/s41586-025-08854-x

关于《通用光子人工智能加速》的评论


暂无评论

发表评论

摘要

Sufi R. Ahmed及其同事在自然界中发表的文章“通用光子人工智能加速度”介绍了一种新型的光子处理器,设计用于人工智能(AI)加速度。这项工作的主要贡献包括:1。**光子处理器设计**: - 研究人员开发了一种通用的光子AI加速器,该加速器利用了光学系统固有的高速并行处理能力。 - 该处理器建立在高级半导体技术的基础上,可以有效地处理各种AI任务。2。**软件堆栈开发**: - 创建了一个全面的软件堆栈,以支持光子处理器,包括用于机器学习(ML)模型的模型编译,优化和部署的工具。 - 团队开发了一种新的自适应块浮点(ABFP)数据格式,以确保在保持准确性的同时有效利用硬件。3。**绩效评估**: - 本文提出了性能基准,表明光子处理器在能源效率和速度方面优于现有的AI加速器。 - 在不同数据类型的各种ML模型(例如RESNET-50)报告了特定的指标,例如推荐吞吐量和功耗。4。**可伸缩性**: - 设计是模块化的,可扩展的,可以集成多个光子处理器,以处理较大的数据集或更复杂的模型。 - 可扩展性确保该技术可以适应未来的AI需求,而无需重新设计工作。###关键技术细节 - **光子处理器体系结构**: - 利用以光速执行矩阵操作的光学互连和处理单元。 - 与CMOS逻辑集成以进行控制,数据管理和接口功能。 - **自适应块浮点(ABFP)格式**: - 旨在根据输入数据特征动态调整精度,在不牺牲准确性的情况下优化性能。 - 增强了与多种ML模型和数据集的兼容性。###含义 - **能源效率**:与传统的电子AI加速器相比,光子处理器显示出功耗显着降低。 - **速度提高**:通过并行光学处理提高速度可以实时或接近实时的推理功能。 - **可伸缩性和灵活性**:模块化体系结构可以轻松缩放和适应从边缘设备到数据中心的不同AI应用程序。### 结论本文提出的研究代表了应用于AI的光子计算领域的重要一步。通过展示出色的性能指标和强大的软件支持,作者为在机器学习系统中更广泛地采用光学技术铺平了道路,从而有可能彻底改变了在各个行业中如何执行AI任务。### 参考-Ahmed,S.R.,Baghdadi,R.,Bernadskiy,M。等。(2025)。通用光子人工智能加速度。自然640,368–374。 - 在整个论文中都引用了对半导体技术,光学互连和AI基准的各种参考。该摘要捕获了文章中提出的研究的本质,并强调了其对AI硬件加速领域的潜在影响。