當(dāng)深度學(xué)習(xí)遭遇瓶頸,AI的下一步該走向何方?圖靈獎(jiǎng)得主給出答案
在2025外灘大會(huì)上,新晉圖靈獎(jiǎng)得主、被譽(yù)為“強(qiáng)化學(xué)習(xí)之父”的理查德·薩頓(Richard Sutton)發(fā)表了一場(chǎng)引人深思的主題演講。他并未沉浸于當(dāng)前AI大模型的輝煌成就,而是直指其核心技術(shù)——深度學(xué)習(xí)在某些方面的根本性局限,并為人工智能的未來,描繪了一條全新的路徑:去中心化神經(jīng)網(wǎng)絡(luò)。
薩頓的觀點(diǎn),為當(dāng)前AI技術(shù)的主流范式帶來了重要的反思。本文將對(duì)他的核心論點(diǎn)進(jìn)行深度解讀,探討為何在他看來,當(dāng)前深度學(xué)習(xí)的路徑面臨嚴(yán)峻挑戰(zhàn),而去中心化AI則為未來發(fā)展提供了富有潛力的方向。
深度學(xué)習(xí)的三大核心挑戰(zhàn)
薩頓教授對(duì)深度學(xué)習(xí)在持續(xù)學(xué)習(xí)(Continual Learning)任務(wù)中的表現(xiàn)提出了批評(píng),他認(rèn)為其存在三大內(nèi)在挑戰(zhàn)。
首先是災(zāi)難性遺忘與可塑性喪失。在持續(xù)的監(jiān)督學(xué)習(xí)中,深度學(xué)習(xí)模型會(huì)逐漸失去學(xué)習(xí)新知識(shí)的能力。有研究表明,隨著學(xué)習(xí)任務(wù)的增多,模型的學(xué)習(xí)率和可塑性會(huì)顯著下降。這意味著,一個(gè)深度學(xué)習(xí)模型在學(xué)會(huì)了任務(wù)B之后,可能就忘記了如何執(zhí)行任務(wù)A。這種“學(xué)新忘舊”的特性,使其不適合需要構(gòu)建能夠終身學(xué)習(xí)的智能體。
其次是模型坍塌。在長(zhǎng)時(shí)間的強(qiáng)化學(xué)習(xí)任務(wù)中,深度學(xué)習(xí)模型可能會(huì)出現(xiàn)性能崩潰的現(xiàn)象。模型在初期學(xué)習(xí)良好,但隨著訓(xùn)練的進(jìn)行,其能力會(huì)逐漸退化。這表明,基于當(dāng)前反向傳播機(jī)制的深度學(xué)習(xí),在面對(duì)需要長(zhǎng)期、持續(xù)探索和優(yōu)化的復(fù)雜任務(wù)時(shí),其穩(wěn)定性存在根本問題。
最后是靜態(tài)知識(shí)轉(zhuǎn)移的局限。薩頓認(rèn)為,目前絕大多數(shù)機(jī)器學(xué)習(xí)的目標(biāo),是將人類已有的、靜態(tài)的知識(shí),轉(zhuǎn)移到一個(gè)缺乏自主學(xué)習(xí)能力的AI上。然而,人類的數(shù)據(jù)紅利正逼近極限。這種依賴外部知識(shí)灌輸?shù)哪J?,難以生成真正的新知識(shí),而這恰恰是智能的核心。
去中心化神經(jīng)網(wǎng)絡(luò)的理論構(gòu)想
為了應(yīng)對(duì)上述挑戰(zhàn),薩頓提出了“去中心化神經(jīng)網(wǎng)絡(luò)”的構(gòu)想。其核心思想是,構(gòu)建一個(gè)沒有中央控制器的網(wǎng)絡(luò)架構(gòu)。在這個(gè)網(wǎng)絡(luò)中,每一個(gè)神經(jīng)元或智能體都擁有自己獨(dú)立的目標(biāo)。整個(gè)網(wǎng)絡(luò)的強(qiáng)大智能,最終是從這些局部目標(biāo)的相互作用與協(xié)作中涌現(xiàn)出來的。
這可以理解為,它不像一個(gè)由全知全能的“皇帝”統(tǒng)治的帝國(guó),而更像一個(gè)由各具專長(zhǎng)的“工匠”和“學(xué)者”組成的、充滿活力的城邦。每個(gè)成員都在追求自己的目標(biāo),但他們的協(xié)作共同造就了整個(gè)城邦的繁榮。
與傳統(tǒng)深度學(xué)習(xí)那種預(yù)先設(shè)定好固定分層結(jié)構(gòu)不同,去中心化網(wǎng)絡(luò)更傾向于一種自然生長(zhǎng)的模式。它從簡(jiǎn)單的輸入輸出單元開始,隨著不斷加入新的特征和神經(jīng)元,網(wǎng)絡(luò)逐漸變得復(fù)雜和強(qiáng)大。
多智能體協(xié)作的興起
薩頓的理論為AI的未來發(fā)展指明了方向,但對(duì)于當(dāng)下的開發(fā)者而言,如何將這種思想付諸實(shí)踐?一個(gè)最直接的路徑,就是構(gòu)建一個(gè)“多智能體協(xié)作”的應(yīng)用架構(gòu)。
未來的復(fù)雜AI應(yīng)用,具備潛力的發(fā)展方向?qū)⒉辉偈且蕾囉谀骋粋€(gè)無所不能的“超級(jí)大腦”,而是通過編排和調(diào)度多個(gè)各有所長(zhǎng)、擁有不同知識(shí)和能力的AI模型協(xié)同工作。這正是“去中心化”理念在工程實(shí)踐層面的體現(xiàn)。
例如,在自動(dòng)駕駛的模擬研發(fā)中,可以用一個(gè)模型專門負(fù)責(zé)視覺感知,一個(gè)模型負(fù)責(zé)路徑規(guī)劃,另一個(gè)模型負(fù)責(zé)決策控制;在醫(yī)療診斷中,可以用一個(gè)模型分析文本病歷,另一個(gè)模型解讀醫(yī)學(xué)影像,協(xié)同給出診斷建議。
要實(shí)現(xiàn)這種“多智能體協(xié)作”,一個(gè)開放、聚合的AI能力平臺(tái)是必不可少的基礎(chǔ)設(shè)施。這類平臺(tái)通常被稱為AI模型即服務(wù)(MaaS)或模型廣場(chǎng),它們匯聚了來自全球的眾多頂尖AI大模型,并為開發(fā)者提供了一個(gè)統(tǒng)一的接口和管理平面。開發(fā)者無需再為每一個(gè)模型單獨(dú)進(jìn)行API的適配和管理,而是可以通過一個(gè)統(tǒng)一的入口,像指揮一個(gè)團(tuán)隊(duì)一樣,靈活地調(diào)度平臺(tái)上的各種模型,這為實(shí)踐薩頓教授的“去中心化協(xié)作”理念,提供了一個(gè)理想的、觸手可及的實(shí)驗(yàn)場(chǎng)。
理查德·薩頓的演講,提醒我們重新思考智能的本質(zhì)。他所指出的深度學(xué)習(xí)局限性,以及倡導(dǎo)的去中心化、持續(xù)學(xué)習(xí)和經(jīng)驗(yàn)驅(qū)動(dòng)的理念,為正處在狂熱與迷思中的AI領(lǐng)域,注入了一劑清醒劑。
從“靜態(tài)知識(shí)轉(zhuǎn)移”到“動(dòng)態(tài)經(jīng)驗(yàn)生成”,從“中央集權(quán)控制”到“去中心化協(xié)作”,這或許是通往通用人工智能的更堅(jiān)實(shí)的道路。而開放、聚合的AI能力平臺(tái),則正在為所有開發(fā)者,提供將這一偉大構(gòu)想付諸實(shí)踐的關(guān)鍵基礎(chǔ)設(shè)施,推動(dòng)整個(gè)AI生態(tài)向著更加開放、協(xié)作和智能化的方向演進(jìn)。

















