当NASA进行世界之外的研究时,地球上的科学家会在将仪器送往外太空任务之前尽可能做好准备。为这些探索任务做准备的一种方式是利用机器学习技术,通过商用仪器或行星任务飞行器上获取的数据来开发算法。
例如,NASA使用质量谱仪火星任务中的仪器用于分析表面样本并识别有机分子。在任务之前开发机器学习算法可以帮助在时间受限的空间操作期间更快更高效地处理行星数据。
2022年,马里兰州格林贝尔特市NASA戈达德太空飞行中心的支持机器学习研究的数据科学家维多利亚·达波安与NASA合作协同创新中心为了举办两项基于机器学习的开放科学挑战,向公众征集创意和解决方案。来自世界各地的参赛者被邀请分析从NASA中心商业仪器中采集的化学数据以及来自火星样品分析(SAM)测试台的数据,后者是好奇号探测车上仪器套件的复制品。这些挑战鼓励参与者在方法上发挥创造力,并提供对其方法和代码的详细描述。
达波伊安说她的团队决定通过公开竞赛来进行这个项目,以便获得新的视角:“我们真的很想听听那些不在我们领域的人的意见,他们不会因为数据的意义或我们的科学规则而产生偏见。”
因此,来自世界各地的1150多名独特参与者参加了比赛,并提交了超过600个解决方案,这些解决方案贡献了用于分析与行星科学相关的岩石和土壤样本的模型。这些挑战作为概念验证项目,旨在分析在单一机器学习应用程序中结合多个数据源的可行性。
除了受益于挑战参与者提供的各种视角外,Da Poian表示,这些挑战在发现解决方案方面既节省时间又节约成本。同时,这些挑战邀请全球社区参与NASA的研究工作,以支持未来的太空探索任务,并且获胜者总共获得了6万美元的奖金(包括两个机会)。
达普安利用所学到的经验与国际研究合作组织前沿发展实验室(Frontier Development Lab)合作,开发了一个新的挑战项目,该实验室汇集了研究人员和领域专家,使用机器学习技术解决复杂问题。
该竞赛名为“保持好奇:利用机器学习分析和解读火星探测仪器的测量数据”,于2024年6月至8月举行。比赛结果包括清理在火星上收集的SAM数据,处理商业和飞行仪器数据以生成一致且适合机器学习的数据集,调查数据增强技术以增加可用于挑战的有限数据量,并探索帮助预测火星地形化学组成的机器学习技术。
“机器学习挑战为我们如何利用实验室数据来训练算法,然后再用这些算法训练飞行数据开启了大门,”Da Poian说。“能够使用我们多年来收集的实验室数据对我们来说是一个巨大的机会,迄今为止的结果非常令人鼓舞。”