這個AI精準模擬人類行為大腦狀態,上Nature了
首個能跨領域精準預測人類認知的基礎模型誕生!
不僅可以完全預判你的行為,還能知道你是如何思考、以及為什么思考。
這是一項最新登上Nature的突破性研究,來自德國的研究團隊只用了5天訓練時間就開發出人類認知的通用計算模型——Centaur。

Centaur現在就像一名專業的心理學家,只需傳統模型Llama的0.15%參數,就可以完美模擬人類在160項心理學實驗中的行為,理解人類如何學習、決策甚至犯錯。
不僅僅受限于單一領域,而是真正的多任務全能選手,性能全面超越傳統的特定領域認知模型。
更驚人的是,其神經表征竟與真人fMRI(功能性磁共振成像)掃描結果高度吻合。
AI,正在成為最懂人類的“讀心者”。
Centaur:心理學與AI的跨界突破
在心理學領域,建立一個統一的認知理論,可以識別和描述所有人類認知、行為和情感,是所有心理學家孜孜不倦的追求。
認知的統一理論是唯一能將我們日益增長的豐富知識,置于理智掌控之下的方法。
那么首先需要構建一個能夠預測和模擬人類行為的通用計算模型,它不是AlphaGo這種專為某一個領域而生的模型,而是面向所有領域、各種情況。
于是,Centaur——首個人類認知基礎模型誕生了。

研究團隊首先為之構建了史上最大規模的人類行為數據集Psych-101,涵蓋160項心理學實驗,涉及60092名參與者、超1000萬次選擇,以及2億多個文本tokens。
數據集包含多臂老虎機、決策制定、記憶、邏輯推理、馬爾可夫決策過程等多種任務。
此外研究人員還將全部實驗數據轉化為自然語言形式,為不同實驗范式提供統一表達格式。
而模型本身基于開源語言模型Llama 3.1 70B構建,采用參數高效微調技術QLoRA(量化低秩適應)進行訓練。
具體而言是在凍結的4位量化基礎模型上,為所有非嵌入層添加秩為8的低秩適配器,最后新增參數僅占基礎模型的0.15%。

然后將模型置于Psych-101數據集上進行微調,使用標準的交叉熵損失函數,只專注聚焦在人類響應token上。
值得注意的是,整個訓練過程在A100 80GB GPU上,只耗時5天時間。
短短5天,一個通用的LLM模型就蛻變成了可以真正“讀懂”人類的認知模型,甚至全面超越傳統模型。
超越傳統認知模型
研究人員為了考驗Centaur的認知能力,設計了一系列實驗驗證。
首先是對人類行為的捕捉,判斷其能否精準地預測人類行為。

實驗將參與者分為90%的訓練組和10%的測試組,負對數似然值作為衡量模型對人類選擇擬合度的指標。
結果顯示,Centaur的負對數似然值為0.44,在擬合度上顯著優于Llama的0.58。
在對未參與訓練者的行為預測表現也優于14種經典認知模型(如前景理論、強化學習模型),平均差異達0.13,且通過了顯著性檢驗。
將模型自身響應反饋給模型本身后,Centaur還表現出了多個與人類相似的行為特征,例如在兩步任務(Two-Step Task)中,它復現了與人類行為分布高度一致的軌跡。
此外還能區別人類與人工智能體的行為,預測人類行為準確率高達64%,而預測人工智能體的行為準確率只有35%。
基于描述選擇反應時間與選項數量關系的希克定律,研究人員分析模型對人類反應時間的預測能力。
結果表明,Centaur 的響應熵所能解釋的反應時間方差比例(條件 R2=0.87)高于 Llama(0.75)和領域特定模型(0.77),顯示出其在捕捉人類行為時間特征方面的優勢。

其次,研究人員還重點探究了Centaur的泛化能力。
- 只修改故事背景,不改變任務內容
實驗將原來的“太空船尋寶”改為“魔毯探險”的新故事后,Centaur在新故事場景下人類行為的預測負對數似然值,依舊顯著優于Llama和領域特定認知模型,說明Centaur不受任務表面描述變化影響。
- 修改任務結構
在原來的兩臂老虎機實驗上,新增成三臂,選擇加一,但Centaur的負對數似然值(0.42)依舊遠低于 Llama(0.62)和領域特定模型(0.98),表明其能適應任務結構的擴展與調整。
- 全新領域的任務
讓模型處理未包含在Psych-101數據集內的邏輯推理任務,Centaur 的負對數似然值(1.65)顯著低于 Llama(1.92),體現出微調后對全新認知領域的預測能力依舊強力。
最后,研究人員還聚焦于Centaur與人類神經活動的對齊性,分析驗證其內部表征與人類大腦活動的聯系。

實驗讓94名參與者完成兩步任務,并記錄下他們的fMRI數據,通過分析,Centaur的各層表征對全腦區域神經活動的皮爾遜相關系數均顯著高于基礎模型Llama,且優于傳統認知模型和隨機初始化控制模型。
尤其在與獎勵相關腦區(如伏隔核)和運動皮層,Centaur的預測表現更為突出,說明其擁有優秀的人類神經活動預測能力。

另外在讓5名參與者閱讀1000個句子的語言理解任務中,Centaur中間層的表征預測效果最佳,包含最豐富信息,且在與語言處理相關的腦區表現最為穩定。
實驗說明,雖然Centaur在訓練過程中沒有明確匹配神經數據,但在微調后卻出乎意料的和人類神經活動呈現出一致性。
據推測,也許是模型內部表征捕捉到了人類認知加工的神經基礎特征。

Centaur的出現證明了構建計算模型實現跨領域捕捉人類行為是可行的。
未來它或許將作為 “計算望遠鏡”,幫助研究者從從海量行為數據中提煉關鍵信息,為統一認知理論的發展提供強有力的數據驅動路徑。
正如作者在論文結尾所言:
是時候將這種通用計算模型,轉化為統一的人類認知理論了。






























