圖靈獎得主Yoshua Bengio:深度學習當務之急,是理解因果關系
深度學習擅長在大量數據中發現模式,但無法解釋它們之間的聯系,而圖靈獎獲得者Yoshua Bengio想要改變這一點。
圖:“將因果關系整合到人工智能中是一件大事!”——Yoshua Bengio
今年3月,Yoshua Bengio憑借著在深度學習技術的突出貢獻而獲得圖靈獎,這是計算機科學領域的最高榮譽。正是深度學習技術掀起了人工智能的復興浪潮,也一步步推動了無人駕駛汽車、即時語音翻譯以及人臉識別成為可能。
而現在,Bengio指出“深度學習已經走到了瓶頸期”。他認為,除非深度學習能夠超越模式識別并真正掌握因果關系的更多信息,否則它根本不可能發揮其全部潛力,也無法帶來真正的AI革命。換句話說,深度學習應當開始理解“為什么”。
這位蒙特利爾大學(University of Montreal)教授已經55歲了,留著濃密的白發與眉毛。他解釋道,深度學習技術在理想的場景下確實表現良好,但如果無法推理出因果關系,就無法接近人類的智力水平。“將因果關系整合到AI當中已經成為目前的頭等大事。”Bengio說,“當前的機器學習實現方法立足一個基本假設,即經過訓練的AI系統在解決實際問題時,面對的數據與訓練數據屬于同一類型。但在現實生活中,情況不可能如此簡單。”
包括深度學習在內,目前的機器學習系統往往專用性極強,只針對特定任務進行訓練,例如識別圖像中的小貓,或者音頻中的口語指令等。自2012年面世以來,深度學習已經展現出了卓越的數據模式識別能力,無論是從醫學影像素材中發現癌癥跡象,還是通過賬目記錄識別欺詐活動,深度學習技術已經被廣泛應用于多種實際場景當中。
但是,深度學習本質上對因果關系是盲目的。與真正的醫生不同,深度學習算法無法解釋為什么特定的圖像模式可能存在病變,這意味著某些危急情況下,我們必須謹慎使用深度學習。
而理解了因果關系之后,現有AI系統將在智能度與執行效率方面更上一層樓。舉個例子,如果要讓一個機器人意識到,快速下落的瓷器極易損壞,就不需要把幾十個花瓶扔到地上再觀察結果。
Bengio補充道,上面的例子也可以延伸到無人駕駛汽車。“人類不需要經歷大量事故,才意識到謹慎駕駛的重要性,因為我們人類可以在腦海中想象事故場景,以便在事故真的發生時做好心理準備。”
問題在于,我們要如何為AI系統賦予這種能力?
Bengio在他的研究實驗室里,正在開發一種能夠識別簡單因果關系的深度學習新版本。他和他的同事最近發表了一篇研究論文,概述了這種方法。他們使用一套數據集,該數據集以概率形式描述了真實世界現象之間的因果關系,諸如吸煙、肺癌等。在此基礎上,他們又創建出直接包含因果關系的多套綜合數據集。
論文中提到的算法,在本質上能夠就哪些變量之間具有因果關系做出基本假設,而后測試不同變量的調整是否與其初步判斷相吻合。
機器最終可能會利用這種方法來形成一種假設,即當物體掉落時可能發生什么,而后通過少數幾次實際觀察東西摔到地板上時,來確認自己的結論是否正確。
Bengio已經參與過一次AI技術革新。在過去幾十年中,他與今年的另外幾位圖靈獎獲得者(包括任職于多倫多大學與谷歌公司的Geoffrey Hinton,以及任職于紐約大學及Facebook的Yann LeCun)一起,共同發展出釋放現代深度學習潛力的思想與工程技術。
深度學習利用人工神經網絡生成并加強數學形式的聯系,從而模擬人類神經元與突觸的學習方式。訓練數據(例如圖像或者音頻)會被饋送至神經網絡當中,神經網絡則對訓練素材進行分析及自我調整,直到能夠以正確的方式做出響應為止。因此在理論上,只要能夠看到足夠多的訓練圖像并擁有充裕的計算能力,深度學習程序即可通過訓練以極高的準確率識別照片中的對象。
深度學習使用人工神經網絡,通過形成和加強連接,在數學上近似于人類神經元和突觸的學習方式。訓練數據,如圖像或音頻,被輸入到一個神經網絡,這個神經網絡會逐漸調整,直到它做出正確的反應。如果深度學習程序能看到大量的訓練圖像,并具有足夠的計算能力,那么它就能被訓練來識別照片中的物體,而且準確率很高。
但是,深度學習算法并不善于概括總結,也很難將自己在一種場景下學習到的知識應用于另一種場景。換句話說,深度學習只能捕捉到現象之間的相關性——例如公雞啼叫與太陽升起,但卻無法考慮產生這種相關性的深層次原因。
其他不少領域已經在因果關系研究方面投入了大量時間與精力,近幾十年來出現了許多探索因果關系的數學技術,也徹底改變了包括社會科學、經濟學以及流行病學在內的多個行業的研究范式。目前,已經有少數研究人員開始努力將因果關系與機器學習結合起來。
憑借因果推理方面的貢獻獲得2011年圖靈獎的Judea Pearl表示,盡管并沒有認真研究過,但Bengio的思考方式給他留下了深刻的印象。Pearl在最近合著的《因果之書:因果關系的新科學(The Book of Why: The New Science of Cause and Effect)》當中提到,如果沒有對因果關系的推理能力,AI的發展將從根本上受到限制。
認知科學實驗也表明,理解因果關系對于人類成長乃至智力發展至關重要,盡管我們尚不清楚人類是如何掌握這種關鍵知識的。
Bengio關于因果關系的研究,代表行業已經在這個問題的探索方面邁出重要一步。雖然只是一小步,但可以由此看到,深度學習正朝著現實主義方向勇敢前行,事實上,盡管這項技術的應用正在快速普及,但已經有越來越多的專家提到“其在語言理解等核心領域仍面臨著嚴重局限”。
在采訪當中,Bengio還對企業嚴重夸大AI及深度學習實際能力的行為表示失望。他指出,“在我看來,商界最好能扭轉這一波不良風氣,現在的炒作氛圍實在太過濃重了。”
其他一些研究人員則認為,對深度學習的過度關注也是造成目前問題的原因之一。紐約大學名譽教授Gary Marcus在最近出版的《重新引導AI:構建我們能夠信任的人工智能(Rebooting AI: Building Artificial Intelligence We Can Trust)》中提到,Bengio對因果推理的關注預示著技術思想層面已經開始出現可喜的變化。
他表示,“目前有太多深度學習項目都單純關注缺少因果關系的粗糙關聯性,這常常導致深度學習系統在真實條件下(明顯不同于訓練場景的條件下)進行測試時,往往拿不出良好的實際表現。”
Marcus認為,人類的行為應當成為指導AI技術發展的重要依據。“當孩子們提出「為什么」的時候,就代表他們想要了解現象背后的因果關系。一旦機器學會提出「為什么」,其智能化水平也將迎來真正的飛躍。”





























