DeepMind:把人工智能和神經(jīng)科學結(jié)合起來,實現(xiàn)良性循環(huán)
人工智能的最新進展引人注目。人工系統(tǒng)在Atari視頻游戲、古老的棋類游戲圍棋以及撲克游戲中已經(jīng)優(yōu)于人類專業(yè)玩家。它們還可以生成與人類無差別的筆跡和語音、在多種語言之間翻譯,甚至將你的假期照片用梵高的風格進行風格重塑。
這些進步可以歸結(jié)為幾個因素,包括新型統(tǒng)計方法的使用和計算機計算能力的增長。但是我們最近在Neuron雜志發(fā)表的觀點認為,有一個因素經(jīng)常被忽視,即實驗神經(jīng)科學和理論神經(jīng)科學的貢獻。
心理學和神經(jīng)科學在人工智能的發(fā)展史上起著關(guān)鍵作用。人工智能的奠基人物諸如 Donald Hebb、Warren McCulloch、Marvin Minsky 以及Geoff Hinton,最初都是被想要理解人腦工作原理的愿望所激勵。事實上,在整個20世紀末期,大部分開發(fā)神經(jīng)網(wǎng)絡(luò)的關(guān)鍵工作并沒有發(fā)生在數(shù)學或者物理實驗室,而是在心理學和神經(jīng)生理學系。
正因為如此重要,將神經(jīng)科學領(lǐng)域和人工智能領(lǐng)域結(jié)合起來的需求比以往任何時候都更加迫切。
在DeepMind,我們認為,盡管這兩個領(lǐng)域都得到了快速發(fā)展,但是研究人員不應該忽視這個觀點。我們督促神經(jīng)科學和人工智能領(lǐng)域的研究者們?nèi)で笠环N能夠讓知識自由流動的共同語言,讓知識的自由流動來推動這兩個領(lǐng)域持續(xù)向前發(fā)展。
對人工智能研究來說,從神經(jīng)科學汲取靈感是非常重要的,我們認為有兩個原因:第一,神經(jīng)科學能夠幫助驗證已經(jīng)存在的人工智能技術(shù)。簡而言之,如果我們發(fā)現(xiàn)我們的一種人造算法能夠模仿人腦中的某個功能,這表明我們的方法或許在正確的方向上了。第二,在構(gòu)建人造大腦的時候,神經(jīng)科學可以為新型的算法和結(jié)構(gòu)提供豐富的靈感來源。歷史上,傳統(tǒng)的人工智能方法都是由基于邏輯的方法和基于理論數(shù)學的模型所主導。我們認為神經(jīng)科學可以通過識別可能對認知功能很關(guān)鍵的生物計算類別對此進行補充。
以一個最近在神經(jīng)科學領(lǐng)域的重要發(fā)現(xiàn)為例:離線體驗「回放」的發(fā)現(xiàn)。在睡眠或者安靜休息的時候,生物大腦會「回放」由早期活躍時段生成的神經(jīng)活動。例如,當老鼠穿過迷宮的時候,「地方」單元隨著老鼠的運動會激活。在休息的時候,在老鼠的大腦中觀察到了相同的神經(jīng)活動序列,貌似老鼠會在精神上重新想象它之前的活動,并用它們?nèi)?yōu)化未來的行為。事實上,對回放的干擾會損害它們后來進行同樣任務時的表現(xiàn)。
乍一看,構(gòu)建一個需要「睡眠」的人工智能體似乎是反直覺的——畢竟,它們應該在它們的程序員睡覺之后在一個可計算的問題上耗很多時間。但是這個原則卻是我們的deep-Q Network(DQN)的關(guān)鍵部分,這是一個僅僅依靠原始像素和分數(shù)作為輸入,通過學習能夠把Atari 2600游戲掌握到超過人類的水平的算法。DQN通過存儲一個它能夠離線「回顧」的訓練數(shù)據(jù)的子集來模仿「經(jīng)驗回放」,這使得它能夠從過去的失敗和成功中學習到新的東西。
這樣的成功給了我們信心,神經(jīng)科學早已成為人工智能思想的重要源泉。展望未來,我們相信神經(jīng)科學在幫助我們處理一些仍未解決的問題上會變得不可或缺,例如高效學習、理解物理世界和想象力。
想象力對人類和動物來說一個十分重要的功能,想象力允許我們在仍未發(fā)生的情況下就可以規(guī)劃未來,當然這是有代價的。舉個簡單的例子,比如規(guī)劃一個假期。為了做到這件事,我們要利用我們關(guān)于這個世界的知識或者「模型」,并且用它來及時地推進或者評估未來的狀態(tài)。這允許我們計算需要走的路徑,或者打包在晴天穿的衣服。盡管人類神經(jīng)科學的前沿研究正在開始揭示支撐這種思維的計算系統(tǒng)和機制,但是很多這種新的理解尚未在人工模型中得到應用。
當下人工智能研究的另一個重要挑戰(zhàn)就是遷移學習。為了能夠高效應對新情況,人工智能體需要在現(xiàn)有知識的基礎(chǔ)上構(gòu)建作出明智決策的能力。人類早已精于此道:人可以開汽車、使用筆記本或者能夠主持一個會議,此外,在面對不熟悉的車輛、操作系統(tǒng)或者社會環(huán)境的時候人類通常也能夠有效應對。
朝著理解這種情況如何發(fā)生在人工智能系統(tǒng)中這個目標,研究者現(xiàn)在開始邁出了第一步。例如,一種叫做「漸進網(wǎng)絡(luò)(progressive network)」的新型網(wǎng)絡(luò)結(jié)構(gòu)能夠利用在一個視頻游戲中習得的知識去學習另外一個視頻游戲。在從仿真機器臂向現(xiàn)實手臂遷移知識的場景中也使用相同的結(jié)構(gòu),這大大地縮短了訓練時間。有趣的是,這些網(wǎng)絡(luò)與人類的連續(xù)任務學習模型有某些相似之處。這些聯(lián)系表明未來的人工智能研究非常有可能從神經(jīng)科學的工作中學習到一些東西。
但是這種知識的交換不可能是單向的,神經(jīng)科學也能夠從人工智能研究中獲益。以強化學習為例——強化學習是當下人工智能研究的核心方法之一。盡管強化學習的原始思想來源于心理學中的動物學習理論,但是它是由機器學習研究者來開發(fā)和闡述的。這些思想又回饋神經(jīng)科學的研究,幫助我們理解神經(jīng)生理現(xiàn)象,例如哺乳動物基底神經(jīng)節(jié)中的多巴胺神經(jīng)元的放電特性。
人工智能研究者從神經(jīng)科學中汲取思想來建立新的技術(shù),神經(jīng)科學家從人工智能體的行為中學習,以更好地解釋生物大腦——如果這兩個領(lǐng)域要持續(xù)地借助彼此的思想發(fā)展,并創(chuàng)建一個良性循環(huán),那么這種一來一往的啟發(fā)是必須的。事實上,由于近期的種種進展,例如光遺傳學,它允許我們精確地測量和操縱腦活動,產(chǎn)生大量能夠使用機器學習工具進行分析的數(shù)據(jù)。
所以我們認為,把智力轉(zhuǎn)換為算法并將其與人類大腦進行比較現(xiàn)在是非常關(guān)鍵的。這不僅能夠加強我們對開發(fā)人工智能這種有望創(chuàng)造新知識并且推動科學發(fā)現(xiàn)的工具的追求,而且還有可能幫助我們更好地理解人類大腦內(nèi)部到底發(fā)生著什么。這有可能揭示神經(jīng)科學中的一些奧妙,例如,創(chuàng)造力、夢,甚至意識的本質(zhì)。正因為如此重要,將神經(jīng)科學領(lǐng)域和人工智能領(lǐng)域結(jié)合起來的需求比以往任何時候都更加迫切。

























