ChatGPT慘敗Llama!MIT官宣AI開(kāi)飛船0%失敗率,馬斯克火星殖民不再是夢(mèng)
剛剛,一項(xiàng)最新關(guān)于AI「駕駛」宇宙飛船的研究剛發(fā)布就火了!
在由Kerbal Space Program衍生的航天挑戰(zhàn)賽中,MIT等研究團(tuán)隊(duì)讓ChatGPT作為「主控」智能體,竟然一舉奪得第二名。
這項(xiàng)比賽被視為太空探索自主化的重要實(shí)驗(yàn)場(chǎng),而AI的表現(xiàn),也預(yù)示著「AI開(kāi)飛船」或許比我們想象的更近!
或許,太空漫游2027真的可以成為現(xiàn)實(shí)!圍繞地球的衛(wèi)星、太空垃圾未來(lái)都可能由AI自主運(yùn)行和處理。
研究團(tuán)隊(duì)并沒(méi)有重度訓(xùn)練模型,而是巧妙地用提示詞工程+少量微調(diào),就讓ChatGPT成功駕馭復(fù)雜的太空任務(wù):追擊衛(wèi)星、規(guī)避偵測(cè)……樣樣精通。
整個(gè)系統(tǒng)由文本狀態(tài)輸入→語(yǔ)言模型決策→代碼執(zhí)行三步組成,展現(xiàn)出LLM模型強(qiáng)大的泛化與適應(yīng)能力。
MIT和馬德里理工大學(xué)這一研究論文已被《空間研究進(jìn)展》(Journal of Advances in Space Research)接收,即將發(fā)表。

論文地址:https://arxiv.org/pdf/2505.19896
研究亮點(diǎn)速覽:
- ChatGPT用文字指令完成飛船導(dǎo)航、控制決策,表現(xiàn)遠(yuǎn)超預(yù)期;
- 研究無(wú)需大規(guī)模訓(xùn)練,充分利用LLM已有知識(shí)與語(yǔ)言理解;
- 雖仍有「幻覺(jué)」等風(fēng)險(xiǎn),但自主化航天已從幻想變?yōu)榭尚新肪€。
AI自主開(kāi)飛船上太空
研究人員長(zhǎng)期以來(lái)一直致力于開(kāi)發(fā)用于衛(wèi)星控制和航天器導(dǎo)航的自主系統(tǒng)。
未來(lái)的衛(wèi)星數(shù)量實(shí)在太多,人類無(wú)法全部手動(dòng)進(jìn)行控制。
而對(duì)于深空探測(cè)來(lái)說(shuō),光速的限制意味著我們無(wú)法實(shí)時(shí)直接控制航天器。
如果我們真的想要在太空領(lǐng)域拓展,就必須讓機(jī)器人自己做決定。
為了鼓勵(lì)創(chuàng)新,近年來(lái)航空研究人員創(chuàng)建了《Kerbal Space Program》博弈挑戰(zhàn)賽。

這是一類基于廣受歡迎的《Kerbal Space Program》電子游戲的試驗(yàn)場(chǎng),讓研究社區(qū)在一個(gè)(某種程度上)真實(shí)的環(huán)境中設(shè)計(jì)、試驗(yàn)和測(cè)試自主系統(tǒng)。
《Kerbal Space Program》(KSP)最早是由墨西哥工作室Squad開(kāi)發(fā)的一款太空飛行模擬視頻游戲,于2015年發(fā)布。

盡管它是一款游戲,但通過(guò)添加模組(mod),它可以被用作模擬環(huán)境,這些模組可以增加諸如更真實(shí)的物理效果等新功能。
盡管KSP并未提供對(duì)現(xiàn)實(shí)的完美模擬,但其精確的軌道力學(xué)機(jī)制受到了贊譽(yù),甚至與NASA建立了合作關(guān)系,使其地位超越了一款普通游戲。
該模擬環(huán)境被限制為一個(gè)二體問(wèn)題,并且僅限于少量行星,最常見(jiàn)的情況是只有一個(gè)名為Kerbin的類地行星。

該挑戰(zhàn)賽包含多個(gè)場(chǎng)景,例如追蹤并攔截衛(wèi)星的任務(wù)以及規(guī)避探測(cè)的任務(wù)。
研究人員決定使用LLM,因?yàn)閭鹘y(tǒng)的控制方法需要經(jīng)過(guò)多輪的訓(xùn)練、反饋和改進(jìn)。
但Kerbal挑戰(zhàn)的本質(zhì)是盡可能逼真,這意味著任務(wù)僅持續(xù)數(shù)小時(shí)。
因此,不斷改進(jìn)模型將變得不切實(shí)際。
LLM之所以如此強(qiáng)大,是因?yàn)樗鼈円呀?jīng)接受了大量人類寫作文本的訓(xùn)練。
因此在最佳情況下,它們只需要少量精心設(shè)計(jì)的提示工程和幾次嘗試,就能為特定情境獲取正確的上下文。
但這樣一個(gè)「對(duì)話」模型真的可以駕駛宇宙飛船嗎?
用GPT和Llama開(kāi)飛船
首先介紹一下KSP挑戰(zhàn)中需要解決的問(wèn)題,智能體通過(guò)推力發(fā)動(dòng)機(jī)控制航天器在所有三個(gè)旋轉(zhuǎn)軸(偏航、俯仰和滾動(dòng))上的運(yùn)動(dòng)。

動(dòng)作是在航天器的參考系下表達(dá)的,包括每個(gè)軸的推力大小以及施加推力的持續(xù)時(shí)間。
KSP挑戰(zhàn)包含以下三種場(chǎng)景:
- 追擊者-逃逸者:智能體控制追擊者。主要目標(biāo)是使追擊者與逃逸者之間的距離最小化。
- 目標(biāo)守衛(wèi):智能體控制劫匪航天器靠近航天器。
- 遮擋太陽(yáng):智能體旨在將航天器定位在逃逸者與太陽(yáng)之間。本研究的討論范圍只有「追擊者-逃逸者」范疇。

在追擊者-逃逸游戲的不同場(chǎng)景中,逃逸者的初始軌道在所有場(chǎng)景中保持不變,而追擊者的初始軌道則有所變化。
追擊者和逃逸者具有相同的飛行器參數(shù)。
評(píng)估指標(biāo)包括追擊者與逃逸者之間的距離(米)、最近接近時(shí)的速度(米/秒)、追擊者燃料消耗量(千克)以及經(jīng)過(guò)的時(shí)間(秒)。
明確了任務(wù),讓我們具體看看GPT和Llama是怎么開(kāi)飛船的,該研究探索了兩種路線:

1. ChatGPT+微調(diào)
選用GPT是因其易于使用,重點(diǎn)使用微調(diào)模型策略。


2. Llama+提示詞工程
選用Llama則是由于其社區(qū)支持和開(kāi)源靈活性,使用提示工程進(jìn)行主要研究路線,并進(jìn)行簡(jiǎn)單微調(diào)。



研究人員開(kāi)發(fā)了一種方法,用于將航天器的給定狀態(tài)及其目標(biāo)以文本形式進(jìn)行翻譯。
然后,他們將其傳遞給LLM,并要求LLM提供如何調(diào)整和操控航天器的建議。
研究人員隨后開(kāi)發(fā)了一個(gè)翻譯層,將LLM基于文本的輸出轉(zhuǎn)換為可操作模擬飛行器的功能代碼。
研究通過(guò)生成多個(gè)軌道的示例,用于收集Llama訓(xùn)練數(shù)據(jù)。

研究還給出了軌道數(shù)據(jù)生成的偽代碼。

通過(guò)一系列簡(jiǎn)短的提示和一些微調(diào),研究人員讓ChatGPT完成了挑戰(zhàn)中的許多測(cè)試任務(wù),并且它在最近的一場(chǎng)競(jìng)賽中最終獲得了第二名。
Llama竟然打敗了GPT
有趣的是,OpenAI的微調(diào)API需要定制,但它提供的工具非常有限,尤其是與Llama相比。
因此,GPT訓(xùn)練的效果在很大程度上取決于數(shù)據(jù)的數(shù)量和質(zhì)量,以及某些調(diào)整(特別是超參數(shù)),其中LRM的影響最為顯著。
思維鏈方法的應(yīng)用顯著提高了飛船駕駛技術(shù)在追擊問(wèn)題中的泛化能力,并成功引導(dǎo)模型實(shí)現(xiàn)了執(zhí)行過(guò)程中的0%失敗率。

Llama的結(jié)果遠(yuǎn)超研究人員預(yù)期。
該模型不僅遵循了一條穩(wěn)定的順行軌道,而且在KSPDG挑戰(zhàn)中表現(xiàn)優(yōu)于幾乎所有其他方法。

需要強(qiáng)調(diào)的是,基礎(chǔ)的Llama模型比GPT模型取得了更好的結(jié)果。
然而,考慮到Llama-3是與GPT-4競(jìng)爭(zhēng)的模型,而非研究中GPT方法中使用的GPT-3.5,這一結(jié)果是在預(yù)期之內(nèi)的。
(果然即使是研究人員也燒不起API的錢,開(kāi)源這一點(diǎn)確實(shí)促進(jìn)了生態(tài)的發(fā)展)

研究團(tuán)隊(duì)表示,這次研究發(fā)現(xiàn)結(jié)果非常令人滿意。
軌道生成和智能體集成表明,使用AI構(gòu)建訓(xùn)練場(chǎng)景可以作為一個(gè)出色且簡(jiǎn)單的模擬引擎替代方案。
雖然這個(gè)研究還屬于早期,并且使用模型也不是目前最新的頂尖AI模型,但這個(gè)研究探索本身就很有啟發(fā)意義。
未來(lái)我們不僅要競(jìng)爭(zhēng)地面資源,太空資源也成為了新時(shí)代的「兵家必爭(zhēng)之地」。
馬斯克的星鏈計(jì)劃已經(jīng)開(kāi)始搶占地球的低空軌道資源。

根據(jù)目前的數(shù)據(jù)統(tǒng)計(jì),截止2025年上半年,在軌的星鏈衛(wèi)星已經(jīng)突破了6500+。
這是一個(gè)非常龐大的數(shù)量,雖然現(xiàn)在星鏈的運(yùn)行只是按照既定軌道,少量需要人類干預(yù),未來(lái)呢?

單純靠人來(lái)控制這些衛(wèi)星完全不夠,也不現(xiàn)實(shí)。
所以這個(gè)研究如果真的能夠讓LLM來(lái)控制太空飛行器,那么將顛覆未來(lái)的太空競(jìng)賽生態(tài)。

在美劇《太空部隊(duì)》中編劇設(shè)想了一個(gè)場(chǎng)景:
中國(guó)的空間站飛行到美國(guó)衛(wèi)星上方時(shí),運(yùn)用機(jī)械臂將美國(guó)衛(wèi)星的翅膀給剪了下來(lái)。
然后,美國(guó)的衛(wèi)星就變成了太空垃圾。
除了編劇的「惡趣味」以外,AI上太空開(kāi)飛船的場(chǎng)景還有很多,比如《特種部隊(duì)2:全面反擊》中太空鎢棒武器。

或者是《火星救援》中的遠(yuǎn)航小隊(duì),如果有了足夠智能的AI,就不用冒險(xiǎn)再返回拯救馬特達(dá)蒙,人類派出AI就夠了。

這些場(chǎng)景未來(lái)還有很多很多。
甚至,最近硅谷投資彼得·蒂爾透露馬斯克說(shuō)要放棄殖民火星的夢(mèng)想。還在采訪中說(shuō)「2024年是埃隆不再相信火星的一年。」
馬斯克的轉(zhuǎn)變是受到他與谷歌DeepMind CEO Demis Hassabis的一次談話影響。
兩人討論了人工智能和星際旅行哪個(gè)會(huì)成為世界上最重要的技術(shù)進(jìn)步。
據(jù)報(bào)道說(shuō),在Hassabis告訴他「你知道我的人工智能將能夠跟隨你去火星」后,Elon沉默了。

不管老馬因?yàn)槭裁丛驅(qū)鹦鞘バ判模侨绻鸄I真的能夠自主駕駛宇宙飛船,也許可以幫助他繼續(xù)殖民火星的夢(mèng)想!

可以設(shè)想一下,未來(lái)進(jìn)行這種太空攻防對(duì)抗、互助救援和殖民外星球的背后,不僅僅比拼人的水平,還有AI的能力——誰(shuí)家的AI更聰明、更智能。
畢竟,在太空探索的背景下,人類的一生還是太過(guò)于短暫,也許只有AI能扛過(guò)時(shí)間的侵蝕了。
人類終將沉睡于時(shí)光的塵埃,而AI,或許是那唯一能在深空中繼續(xù)訴說(shuō)文明故事的見(jiàn)證者。
——ChatGPT





































