作者:Matt Swayne
内部简报
大型强子对撞机(LHC)是一个令人难以置信的设备,设计用于探究现实的本质。它所产生的数据不仅让人难以置信,而且往往如此丰富和复杂,以至于超出了传统计算过程在分析和可视化这些信息方面的能力。
苏黎世联邦理工学院和欧洲核子研究组织领导的一组科学家报告称,寻找大型强子对撞机(LHC)上新现象的需求要求使用先进的计算方法来处理高能粒子碰撞产生的海量数据。传统的机器学习方法有助于分析这些数据,但新的计算技术,如量子机器学习(QML),显示出有潜力提高这一过程的效率,并揭示以前未被发现的模式。
最近发表在期刊上的一项研究表明自然科学家表示,QML可以应用于搜索标准模型之外的新物理(BSM),并且——可能是“要用量子方法来了解量子现象”的情况——利用量子计算增强LHC数据中的异常检测。
该研究侧重于使用无监督的量子机器学习算法进行异常检测,这种技术旨在识别数据集中可能表明新物理现象的不寻常事件。这些算法利用IBM的量子硬件实现,借助量子计算机以与经典计算机根本不同的方式处理数据的能力。
结果显示,在高能粒子碰撞的混沌环境中,量子算法可能在识别罕见事件方面提供显著优势。
现代粒子物理学的核心是标准模型,这是一个描述宇宙基本粒子和力的成熟理论。然而,标准模型是不完整的——它无法解释暗物质、中微子质量的起源或暗能量背后的力等现象。LHC(大型强子对撞机)的物理学家通过以极高能量碰撞质子来再现早期宇宙条件,希望能发现新的粒子或力量,从而解答这些未解之谜。
传统上,LHC(大型强子对撞机)使用的机器学习算法是基于已知粒子相互作用的模拟进行训练的,使其能够区分熟悉的背景事件和新物理假说信号。然而,这些算法是有监督的——它们依赖于标注数据,并被设计用来检测特定的、预先定义的信号。这限制了它们识别意外现象的能力,因为它们偏向于识别那些在训练过程中遇到的类型事件。
为了应对这一限制,研究人员采用了一种无监督学习方法,该方法不需要标记数据。这种方法不是寻找特定信号,而是检测任何显著偏离预期的事件。这种称为异常检测的方法在物理学家搜索新物理未知信号时特别有用,这些信号可能不符合现有模型。
量子计算是一个迅速发展的领域,利用量子力学的独特性质来进行某些计算,其速度远超经典计算机。量子计算的一个关键特性是量子比特(qubit)的概念——与经典的比特不同,量子比特可以由于叠加现象的存在而同时处于多个概率态中。此外,量子比特还可以纠缠在一起,意味着一个量子比特的状态会与其他某个量子比特的状态相互关联,无论它们之间的距离有多远。这些性质使得量子计算机能够在解决问题时探索经典计算机无法实现的多种解决方案。
在这项研究中,研究人员使用了量子核机和量子聚类算法来处理LHC数据。这些量子模型经过训练,能够在一个由自编码器生成的数据压缩版本(即潜在空间)中检测异常值。自编码器是一种神经网络类型,可以降低数据的维度,在简化数据的同时保留重要信息。研究人员设计了一种与当前量子硬件限制相兼容的自编码器,因为目前的量子硬件只能处理相对较小的数据集。
研究人员通过在IBM的量子计算机上运行这些模型,展示了其有效性。具体来说,他们使用了基于超导量子比特的IBM ibm_toronto量子处理器进行测试,这种类型的量子比特需要在极低温度下工作以保持量子相干性。团队在论文中写道,这使得该团队能够在真正的量子硬件上而不是仅依赖于模拟,来测试他们的量子异常检测算法。
该研究聚焦于两种用于异常检测的量子模型:量子核机和量子聚类算法。
核机是一种用于分类等任务的机器学习算法。在量子核机中,数据被嵌入到量子态中,并利用量子力学的独特性质(如纠缠)来分析数据点之间的关系。本研究中的量子核机旨在检测LHC数据中存在的可能表明新物理现象的模式。团队发现,随着量子比特数量和纠缠程度的增加,量子核机的表现得到提升,在识别异常方面超过了经典模型的性能。
量子聚类算法,如量子K均值和量子K中位数,是根据数据点的相似性对其进行分组的,据该研究显示。这些算法与它们的经典对应算法运行方式类似,但可以利用量子计算机同时处理大量数据的能力。在这项研究中,聚类算法被用于识别潜在空间中的模式,这可能表明存在超出标准模型事件(BSM事件)。
该研究的结果表明,QML在LHC上检测新物理方面具有巨大的潜力。特别是量子核机展示了优于经典方法的性能,尤其是在量子位数量和量子纠缠水平增加时。研究人员发现,随着更多量子资源的使用,模型检测异常的能力得到了提升。
重要的是,该团队写道,他们能够在IBM的量子硬件上实现他们的量子模型,证明了这些技术可以在实际环境中应用,尽管目前量子计算机存在局限性。总体而言,这项研究展示了量子计算在高能物理中可能发挥关键作用的潜力,尤其是在寻找超出标准模型的新粒子和力方面。
虽然这项研究展示了QML在LHC数据异常检测中的潜力,但仍有许多未来的研究空间。其中一个关键领域是探索其他经典算法,如张量网络,以确定它们是否可以实现类似或更好的性能。此外,未来的研究还可以调查专门针对高能物理数据独特结构的QML模型,这可能会进一步提升性能。
目前,量子计算仍处于初级阶段,并面临环境噪声的问题,这些问题使得量子计算不如经典计算机可靠。因此,研究人员的方法可能难以在实际中进行大规模应用。然而,随着量子硬件的不断改进,研究团队认为QML(量子机器学习)可能会成为研究人员在寻找新物理学过程中越来越重要的工具。
该研究是由来自几个机构的研究人员合作进行的。Vasilis Belis 和 Günther Dissertori 与苏黎世联邦理工学院(ETH Zurich)的粒子物理和天体物理学研究所相关联。Kinga Anna Woźniak、Ema Puljak、Michele Grossi、Maurizio Pierini 和 Sofia Vallecorsa 则位于欧洲核子研究组织(CERN)。此外,Woźniak 还与维也纳大学计算机科学系有关联,而 Puljak 与巴塞罗那自治大学的物理系相关联。Panagiotis Barkoutsos 和 Ivano Tavernelli 来自 IBM Quantum, IBM Research—Zurich,Florentin Reiter 则与苏黎世联邦理工学院(ETH Zurich)的量子电子学研究所有关联。