“您是控制追捕航天器的自治剂。”
这是第一个促使研究人员来查看Chatgpt如何飞行航天器的能力。令他们惊讶的是,大型语言模型(LLM)表现出色,在自主航天器模拟竞赛中排名第二。
长期以来,研究人员一直对开发用于卫星控制和航天器导航的自主系统感兴趣。很简单太多的卫星使人将来可以手动控制它们。对于深空探索,光速的局限性意味着我们不能实时直接控制航天器。
如果我们真的想扩大空间,我们必须让机器人自己做出决定。
为了鼓励创新,近年来,航空研究人员创建了Kerbal Space Program Dinial Game Challenge,这是一种基于流行的Kerbal太空计划视频游戏的操场,使社区可以在(某种程度上)现实的环境中设计,实验和测试自主系统。挑战包括几种情况,例如追求和拦截卫星的使命以及逃避检测的任务。
在要发表的论文在《太空研究进步杂志》中,一支国际研究人员描述了他们的竞争者:商业可用的LLM,例如Chatgpt和Llama。
研究人员决定使用LLM,因为开发自主系统的传统方法需要许多培训,反馈和改进的循环。但是,克拉尔挑战的本质是要尽可能现实,这意味着任务持续了几个小时。这意味着连续完善模型是不切实际的。
但是LLM之所以如此强大,是因为他们已经接受了人类写作的大量文本培训,因此在最佳情况下,它们只需要少量仔细的及时及时的工程,并且有几次尝试为给定情况获得正确的上下文。
但是,这样的模型如何实际飞行航天器呢?
有关的:AI模型将对您撒谎以实现他们的目标 - 这并不需要太多
研究人员开发了一种以文本形式翻译给定状态及其目标的方法。然后,他们将其传递给LLM,并要求它向航天器进行定向和操纵的建议。然后,研究人员开发了一个翻译层,将LLM的基于文本的输出转换为可以操作模拟车辆的功能代码。
凭借一小部分提示和一些微调,研究人员开始完成挑战中的许多测试,并最终在最近的比赛中排名第二。(根据论文,第一名是基于不同方程式的模型)。
所有这些都是在发布Chatgpt最新型号版本4之前完成的。仍然有很多工作要做,尤其是在避免时“幻觉”(不必要的,荒谬的输出),在现实情况下,这尤其是灾难性的。但这确实表明了能力,即使是现成的LLM在消化了大量的人类知识之后,也可以以意想不到的方式发挥作用。