當AI成為預言家:大數據時代,我們正在失去理解世界的能力嗎?
最近,我在斯坦福大學的一篇文章中讀到了神經科學家Grace Huckins的觀點,她提出了一個令人深思的問題:"雖然強大的AI工具和海量數據集正在推動實際進步,但它們可能沒有深化我們對宇宙的理解。"
這句話像一記重錘,敲在了我的思考深處。在這個AI大爆炸的時代,我們每天都在驚嘆于技術的進步:AlphaFold預測蛋白質結構的準確性超越了實驗方法,大型語言模型能夠寫出看似有深度的文章,AI系統可以識別出人類肉眼無法察覺的模式...但是,這些進步真的讓我們更理解這個世界了嗎?
一個被遺忘的"微處理器論文"
Grace Huckins在她的獲獎文章《理解的終結》中提到了一個有趣的實驗,被稱為"微處理器論文"。這個實驗由賓夕法尼亞大學教授Konrad Kording和他的學生Eric Jonas進行,他們試圖用神經科學的方法來理解一個計算機芯片的工作原理。
聽起來很瘋狂,對吧?他們不是去閱讀芯片的技術文檔,而是像研究大腦一樣,記錄每個"神經元"(晶體管)的電活動,觀察當單個"神經元"被破壞時"行為"如何變化。他們收集了大量數據,使用了當時最先進的分析方法,但結果令人沮喪:所有這些數據并沒有幫助他們理解芯片是如何工作的。
"我們的結果遠遠達不到我們所說的令人滿意的理解,"他們寫道。沒有新的理論和分析方法,更多的數據不會幫助任何人理解大腦的工作原理。
這個實驗已經過去了近十年,但它的警示意義在今天顯得更加重要。神經科學對數據的迷戀只增不減:西雅圖的艾倫研究所正在詳盡編目人類和小鼠大腦中的神經元,去年,一個國際科學家聯盟發布了果蠅大腦的完整圖譜——包含超過1000萬個個別的神經元到神經元連接。
而分析這些數據的工具也隨著深度學習和生成式AI的崛起而變得更加強大。在過去的幾年里,神經科學家們已經使用AI工具來編寫能夠激活大腦特定區域的句子,模擬嬰兒大腦學習如何響應視覺世界的過程,甚至僅根據大腦活動重建某人正在收聽的播客節目。
但是,盡管這些研究極大地提高了我們操縱人腦、解碼其活動并在計算機中準確建模的能力,但它們對大腦如何完成所有這些非凡事情的洞察卻相當有限。
理解與預測的分離
Grace Huckins指出了一個核心問題:我們正處于科學運作方式發生根本性變革的時期。以前,科學的目標(開發新技術和干預措施與理解宇宙)是同一個目標,但現在大數據和AI已經分離了這兩個目標,我們有責任決定哪個更重要。
"數據給了我們不需要理解周圍世界的許可,"她寫道,"它是否會讓我們失望,取決于我們如何使用這種許可。"
這種理解與預測的分離在AlphaFold的例子中表現得尤為明顯。AlphaFold是DeepMind開發的蛋白質結構預測系統,它在2020年的CASP14評估中取得了突破性的成功。讓我通過一個表格來展示AlphaFold與傳統方法的對比:

作為比較,一個碳原子的寬度約為1.4 ?。AlphaFold的精度已經達到了原子級別,這在以前是不可想象的。
但是,正如Grace Huckins所指出的,"AlphaFold是一個巨大的、極其復雜的系統,沒有人理解它是如何工作的。它能做出很好的預測,但這些預測的來源是一個謎。"
這種情況讓我想起了William Burns在《硅幻覺》一文中的觀點:"AI在科學中的應用可能掩蓋了比它揭示的更多的問題,加劇了它聲稱要解決的問題。"
AI:沒有理解的預測機器
大多數AI系統本質上是預測機器:它們處理大量數據以找到統計模式,從而能夠從輸入預測輸出。在獲得數據之前,這些系統并不智能。它們無法訪問我們人類用來理解世界的任何理論或模型,因此它們需要大量數據來發現所需的模式——遠遠超過任何人類能夠理解的數據量。
而且因為它們非常擅長處理大量數據,它們可以做出比任何人類都更好的預測——無需理解。
在過去的幾年里,AI系統已被用于預測各種科學學科中的各種結果。它們可以識別哪些分子可能成為良好的抗生素,選擇哪種抗抑郁藥可能對特定患者最有效,并設計新型電池。我們還沒有能夠解釋為什么特定患者對Prozac的反應比Zoloft更好的抑郁癥理論。但有了AI和大數據,這不再是必需的。
Grace Huckins提出了一個發人深省的問題:"如果AI系統真的贏得了諾貝爾獎,它不會是第一個在沒有理解的情況下實現這一目標的代理人:Alexander Fleming偶然發現了青霉素,從而拯救了無數生命。但沒有理解的創新的系統化,不啻為一場革命。幾個世紀以來,理解一直是實現科學最受贊譽的實際、預測依賴目標——技術創新、災難預測、藥物發現——的關鍵步驟。隨著理解在這個過程中越來越被邊緣化,我們正在進入一個新的科學時代。"
科學理解的危機
這種理解與預測的分離并非憑空出現。William Burns指出,科學本身在過去二十年里一直處于一種智力危機中。例如,人類基因組項目曾預期會帶來新藥物的繁榮,但未能實現其最樂觀的承諾。
2008年,一家大型制藥公司的科學家在一篇文章中發現:"公司為增加新藥輸出所做的一切都沒有奏效,包括合并、收購、重組和流程改進。"
當前危機的原因不僅僅是運氣不好或管理不善。已故的Carl Woese,一位反對"工程化"生物學的特立獨行者,曾在2004年寫道:
"允許生物學成為一門工程學科,允許科學滑入改變生活世界而不試圖理解它的角色,對社會是一種危險。"
他主張科學應該尋求理解世界,而不是主要為了改變它。
理解的三個維度
在一篇發表在Nature Reviews Physics上的文章中,作者們提出了計算機輔助科學理解的三個維度。雖然我無法獲取完整內容,但從摘要中可以看出,他們試圖回答一個核心問題:"先進的計算系統,特別是人工智能,如何能夠促進新的科學理解或自主獲得理解?"
這個問題正是Grace Huckins所關心的。她并不是全盤否定AI在科學中的作用,而是擔心我們可能會因為追求預測和實際效益而忽視了理解的重要性。
我們需要什么樣的科學?
作為一個長期關注AI發展的人,我深深被Grace Huckins的觀點所觸動。在這個AI大爆炸的時代,我們每天都在驚嘆于技術的進步,但我們是否停下來思考過:這些進步真的讓我們更理解這個世界了嗎?
AlphaFold可以預測蛋白質結構,但我們真的理解蛋白質是如何折疊的嗎?大型語言模型可以生成看似有深度的文章,但它們真的理解語言的意義嗎?AI系統可以識別出人類肉眼無法察覺的模式,但它們真的理解這些模式背后的原理嗎?
這些問題不僅僅關乎科學,更關乎我們作為人類的本質。理解世界是我們人類的基本需求之一,是我們區別于其他生物的關鍵特征。如果我們把這種能力完全交給機器,我們將會失去什么?
Grace Huckins的觀點并不是要我們拒絕AI和大數據,而是要我們重新思考科學的本質和目標。她認為,既然大數據和AI已經分離了科學的兩個目標(開發新技術和干預措施與理解宇宙),我們有責任決定哪個更重要。
在我看來,理解應該始終是科學的核心目標。預測和實際應用固然重要,但它們不應該以犧牲理解為代價。正如Carl Woese所說,"科學應該尋求理解世界,而不是主要為了改變它。"


























