计算机科学家彼得·伯克(Peter Burke)证明,如果由处理程序正确提示,机器人可以使用生成的AI模型和托管硬件进行编程。
他解释说这个项目预印纸,是迈向终结者的一步。
伯克的研究开始说:“在阿诺德·施瓦辛格(Arnold Schwarzenegger)的终结者中,机器人变得自我意识并占领了世界。”“在本文中,我们朝着这个方向迈出了第一步:机器人(AI代码写作机)从头开始,用最少的人类输入(另一个机器人的大脑,无人机)创造出来。”
自主捕获不再是奢侈品,而是空间AI的基础
伯克(Burke)是加利福尼亚大学尔湾分校的电气工程和计算机科学教授,一直等到他的论文结束,以表达他的希望,即读者可能会假设“终结者的结果永远不会发生。
寄存器伯克问他是否愿意讨论该项目,但他拒绝了禁运协议的条款,而该论文的标题为“机器人建立了机器人的大脑:AI生成的无人机命令和控制站,托管在天空中”,科学机器人正在审查。
本文为“机器人”一词使用了两个特定的定义。描述了在本地笔记本电脑和编程其他机器人的云中运行的各种生成的AI模型 - 配备了A的无人机覆盆子pi零2 w,服务器打算运行控制系统代码。
通常,控制系统或地面控制系统(GCS)将在无人机操作员可用的地面计算机上运行,该计算机将通过无线遥测链路控制无人机。任务计划者和Q GroundControl是这种软件的示例。
正如伯克所描述的那样,GC是一个中间大脑,处理实时映射,任务计划和无人机配置。较低的大脑将是无人机的固件(例如ArdupiLot),高级大脑将是机器人操作系统(ROS)或其他处理自动碰撞避免的代码。人类飞行员也可能参与其中。
Burke所做的事情表明,可以提示生成AI模型编写创建实时,自托管的无人机GCS或更确切地说是WebGC所需的代码,因为该代码在无人机上的Raspberry Pi Zero 2 W卡上运行了烧瓶Web服务器。因此,无人机托管了自己的AI撰写的Control网站,可以通过Internet访问。
该项目涉及一系列具有各种AI模型(Claude,Gemini,Chatgpt)和AI IDES(VS Code,Cursor,Windsurf)的冲刺,每种都在实施一套不断发展的功能方面发挥了一定作用。
例如,最初的Sprint专注于使用Claude在浏览器中使用Claude编码基于地面的GC。它包括以下提示:
冲刺开始得很好,但是大约十二个提示,该模型停止工作,因为对话(一系列提示和响应)消耗了更多的令牌Claude的上下文窗口。
随后使用Gemini 2.5进行尝试,并且每个人都会遇到问题。双子座会话是由bash shell脚本错误出轨的。光标会话导致了功能性原型,但是开发人员需要重构将项目分解成足够小的部分以适应模型上下文的限制。
第四次使用风帆冲浪的冲刺终于成功了。在2.5周的时间里,AI生成的WebGC花费了大约100个小时的人工劳动力,并产生了10K的代码。
比伯克估计要少20个小时,以创建与一个名为的项目相当CloudStation,在过去的四年中,伯克和少数学生成长。
本文的观察之一是,当前的AI模型无法处理超过10,000行代码。伯克引用了最近的一个学习(S. Rando等人)关于这一点发现,当上下文长度从32K增加到256K令牌时,Claude 3.5十四行诗的准确性从29%下降到3%,并说他的经验与Rando的发现是一致的,假设一行代码为10标记。
空间数据Biz Geolava的首席执行官HantzFé©Vry告诉寄存器在一封电子邮件中,他发现无人机项目引人入胜。
他说:“无人机系统通过生成AI自动脚手架的指挥和控制中心的想法不仅雄心勃勃,而且还与边境空间智能前进的方向高度一致。”“但是,我坚信为安全起见应该有艰苦的检查和界限。”
该论文确实指出,如果需要手动覆盖,则在无人机项目期间保持了人类控制下的冗余发射器。
根据他经营Geolava的经验,Fâ©Vry说,这些系统的出现标志着航空影像业务的转变。
他说:“空中图像变得越来越容易获得。”“自主捕获不再是一种奢侈品,而是空间AI的基础,无论是来自无人机,平流层还是狮子座(低地轨道)捕获。就像本文中描述的那样的系统都瞥见了接下来的事物,即接近实时的感应,计划和推理是近乎实时的。即使是部分自动化的平台。
Fé©vry表示,这些系统的真实测试将是生成AI系统能够处理对抗性或模棱两可的环境。
他解释说:“在模拟或以前的假设中,脚手架控制循环是一件事。”“当地形,任务目标或系统拓扑变化时,这是另一个适应。但是,长期的影响很大:这种工作预示了可推广的自主权,而不仅仅是特定于任务的机器人技术。”
我们从《终结者3:机器的崛起》中留下了约翰·康纳(John Connor)的话:“未来没有写。没有命运,而是我们为自己所做的一切。”®