1年智能體落地,3年獲普利策獎,6年或引發(fā)危機!Django之父6大預(yù)測
AI發(fā)展日新月異,可謂「亂花漸欲迷人眼」,很難預(yù)測未來的世界到底如何。
而Web框架Django之父Simon Willison,這一次他走出舒適區(qū),大膽跨界預(yù)測未來AI發(fā)展趨勢!
在近日的播客中,他預(yù)測了未來1、3、6年不同階段的AI發(fā)展以及可能的結(jié)果。
參加完播客之后,Simon Willison把對未來的預(yù)測擴展為博客文章。

主要預(yù)測如下:
1. 一年內(nèi),除了編程和科研智能體,其他智能體難以落地。
2. 三年內(nèi),某人將在GenAI工具輔助下,拿下普利策獎;在日常工作,記者熟練利用LLM,處理數(shù)據(jù);在個人數(shù)據(jù)保護上,法律取得實質(zhì)性進展。
3. 六年后,AI將簡化藝術(shù)創(chuàng)作,解放人類的藝術(shù)創(chuàng)意。但如果AGI取代大部分人類的工作,可能會引發(fā)大規(guī)模社會動蕩,后果不堪設(shè)想。
一年內(nèi)智能體預(yù)測:第一部分
在2024年,Simon評論到「智能體」還沒有真正發(fā)生。

Simon認為,在2025年將看到更多關(guān)于智能體的炒作,但結(jié)果將讓大多數(shù)「智能體」的粉絲感到失望。
在智能體(Agent)上,Simon預(yù)見將有大量資金被白白浪費。
「旅行智能體」不會成功
如果問十個人,你會得到十個稍微不同的答案——Simon收集并用AI總結(jié)了不同的答案。

鏈接:https://gist.github.com/simonw/beaa5f90133b30724c5cc1c4008d0654
為了簡化論證,Simon選了一個他認為不會實現(xiàn)的定義:可以代表用戶去半自主行動的AI助手。
Simon把這個定義稱為「旅行智能體」式的智能體,因為當描述「智能體」時,不知為何,人們總會聯(lián)想到預(yù)定航班、酒店以及規(guī)劃行程。
讓當前的LLM做出重要決策——比如花錢買什么——是一個非常糟糕的主意。
它們不可靠,但更重要的是,它們太容易受騙了。
如果你給AI助手一張信用卡,并放任它的行動,你要確保,在第一個聲稱提供最佳優(yōu)惠的網(wǎng)站上, 它不會馬上點擊「購買」按鈕!
因為點擊一下「購買」,就能把你的銀行賬戶信息轉(zhuǎn)給黑客,從而掏空你的「錢包」。
而現(xiàn)在還無法避免這一點。
之所以還沒有看到LLM驅(qū)動的智能體,就是因為可靠性。
Simon對這點深信不疑,盡管自從ChatGPT首次發(fā)布以來,這個想法就吸引了大量關(guān)注。
接下來的12個月,發(fā)布的模型中,只要有一個能完全避免這一點,Simon都會喜出望外。
因為他認為解決受騙問題非常難,難得出奇。
一年內(nèi):編程和科研智能體行得通
Simon相信有兩類「智能體」確實可行,而且事實已經(jīng)證明它們確實有效。
編程助手
第一類是編程助手——讓LLM寫代碼、執(zhí)行并根據(jù)結(jié)果修改代碼,不斷循環(huán)。
在2023年3月或4月,Simon第一次看到這種模式:OpenAI用Code Interpreter演示了這一點。
ChatGPT可以利用Python解決問題:它會編寫代碼,并在安全沙箱中(可能是Kubernetes)執(zhí)行代碼,然后根據(jù)輸出或錯誤信息判斷目標是否已達到。
這種模式非常好,在2023年初的模型(最初使用的是GPT-4)中效果非常好,今天依然如此。
在同年10月,Claude也發(fā)布了自己的版本(Claude Analysis,使用在瀏覽器中運行的JavaScript),Mistral和Gemini也有類似的功能,還有許多其他工具實現(xiàn)了相同的模式。
科研助手
第二類智能體是科研助手——LLM能夠多次搜索,收集信息,并將其整合成答案或者撰寫報告。
在這一領(lǐng)域,Perplexity和ChatGPT Search已經(jīng)運作了一段時間,但Simon印象最深刻的是Google Gemini的Deep Research工具。
比如,他向Deep Research提出這樣的問題:
Pillar Point Harbor是北美西海岸最大的棕色鵜鶘棲息地之一。
找到其他的棲息地。
Gemini會起草計劃,利用、谷歌搜索訪問幾十個網(wǎng)站,然后整合報告(并附上重要的引用),描述發(fā)現(xiàn)的內(nèi)容。
它給出的計劃是:
Pillar Point Harbor是北美西海岸最大的棕色鵜鶘棲息地之一。找到北美西海岸其他大的棕色鵜鶘棲息地。
1. 查找北美西海岸棕色鵜鶘棲息地的列表。
2. 查找關(guān)于棕色鵜鶘棲息地及其大小的研究論文或文章。
3. 查找來自鳥類觀察組織或政府機構(gòu)關(guān)于棕色鵜鶘棲息地的信息。
4. 將(3)中找到的棲息地大小與Pillar Point Harbor棲息地的大小進行比較。
5. 查找與棕色鵜鶘棲息地和其種群相關(guān)的新聞文章或最新報告。
它挖掘了大量的細節(jié),包括2016-2019年太平洋棕色鵜鶘調(diào)查報告中的PDF文件,而Simon最關(guān)心的就是這些——其中包含的列表讓他很滿意:
十大超級棲息地(通常棲息超過500只鵜鶘的地方):
- 阿拉米達防波堤(Alameda Breakwater),加利福尼亞州(3,183)
- 支柱點港(Pillar Point Harbor),加利福尼亞州(1,481)
- 東沙島(East Sand Island),俄勒岡州(1,121)
- 阿諾新月州立公園(Ano Nuevo State Park),加利福尼亞州(1,068)
- 薩利納斯河口(Salinas River mouth),加利福尼亞州(762)
- 博利納斯瀉湖(Bolinas Lagoon),加利福尼亞州(755)
- 莫羅巖(Morro Rock),加利福尼亞州(725)
- 莫斯蘭丁(Moss landing),加利福尼亞州(570)
- 克雷森特城港(Crescent City Harbor),加利福尼亞州(514)
- Tomales鳥巖(Bird Rock Tomales),加利福尼亞州(514)
Simon才知道,他所在的支柱點港(Pillar Point Harbor)是第二大棲息地!

對Simon來說,利用當前的LLM,完全可以自己構(gòu)建科研助手。
它們能夠驅(qū)動工具,能提出相對淺顯的研究計劃(尋找新聞文章和研究論文)。而且如果搜索并收集到適當?shù)纳舷挛模鼈兙湍芎铣珊侠淼拇鸢浮?/span>
Google尤其擅長此道:他們擁有全球最大的網(wǎng)站搜索索引,而且Gemini模型的上下文可以包含200萬token。
Simon預(yù)計Deep Research會越來越好,并且吸引來大量競爭者。
三年后:AI輔助拿下普利策獎
Simon做了一個有點自利(self-serving)的預(yù)測:認為三年之內(nèi),有人將因由生成式AI工具輔助的調(diào)查報道而獲得普利策獎。
但并不是說LLM會寫這篇文章!
他依然認為,讓LLM代替人寫文章,是最無趣的應(yīng)用之一。
之所以稱這個預(yù)測是自利的,是因為Simon希望他能推動這一事件的發(fā)生!
他開源了數(shù)據(jù)新聞工具套件Datasette,還在不斷增加AI功能。
比如,利用LLM來數(shù)據(jù)增強;從非結(jié)構(gòu)化文本中,提取結(jié)構(gòu)化數(shù)據(jù)并轉(zhuǎn)化為表格。

他的夢想是這些工具——或者類似的工具——能夠被用于獲獎的調(diào)查報道。
他之所以選擇三年這個時間,就是因為讓人們普遍了解如何負責(zé)任地、有效地使用這些工具,并將應(yīng)用于實際工作,需要這么長時間。
LLM并不是新聞業(yè)的天然的契合點:記者尋求真相,而LLM通常容易產(chǎn)生幻覺,捏造事實。
但是,記者也非常擅長從不可信的來源中提取有用信息——這也是新聞工作的重要部分。
一下兩個領(lǐng)域,他認為LLM特別適合新聞業(yè):
- 結(jié)構(gòu)化數(shù)據(jù)提取。如果利用《信息自由法》,成功獲得了1萬份PDF文件,那么需要有人或某些工具來閱讀這些文件,并找到暗藏的故事。而LLM非常擅長處理大量信息,并整理出有意義的內(nèi)容。它們可以生成線索,幫助找出值得深入調(diào)查的故事。
- 編程輔助。編寫代碼、分析數(shù)據(jù)是現(xiàn)代數(shù)據(jù)新聞的重要部分——從SQL查詢到數(shù)據(jù)清理腳本、定制網(wǎng)絡(luò)抓取工具或可視化工具,都可以幫助從雜亂的信息中找到有價值的信號。但大多數(shù)報社并沒有程序員團隊:Simon認為在三年內(nèi),將圍繞這種模式構(gòu)建足夠強大的工具,能讓非程序員記者在報道過程輕松使用這些工具。
Simon希望他自己能夠開發(fā)這類工具!
所以他對未來三年的具體預(yù)測是:有人將憑借少量的LLM輔助贏得普利策獎。
更普遍的預(yù)測是:三年后,大多數(shù)專業(yè)消息人士將LLM作為日常工作流的一部分,而且使用方式也越來越復(fù)雜,但大家卻習(xí)以為常、熟視無睹。
三年后:隱私法將落地
另一個三年后的預(yù)測涉及隱私立法。
定向廣告和人們粘貼到模型的數(shù)據(jù)到底會發(fā)生什么,已經(jīng)引起了人們的杯弓蛇影(往往是有理由的),而且還在不斷增長。
Simon曾寫過,蘋果通過監(jiān)聽手機麥克風(fēng)來定向廣告,是「無法根除的陰謀論」。

過去, 他也曾寫過關(guān)于AI信任危機的文章:許多人拒絕相信模型并不會基于他們的輸入數(shù)據(jù)進行訓(xùn)練,而且背后的公司已經(jīng)反復(fù)否認。

他認為,AI行業(yè)本身將從立法中受益匪淺,特別是在明確用戶提交數(shù)據(jù)訓(xùn)練方面,而更一般的科技行業(yè),也亟需在數(shù)據(jù)保留和定向廣告等方面制定更嚴格的規(guī)則。
在未來四年,Simon不指望美國聯(lián)邦政府能通過相關(guān)立法,但預(yù)計,在州級或國際層面,會看到更多具有實際執(zhí)行力的隱私法規(guī)。
Simon希望不要因此產(chǎn)生新一代的cookie同意條款。
六年后的烏托邦:令人稱奇的藝術(shù)
對于六年后的預(yù)測,Simon選擇了兩個對立的預(yù)測,一個樂觀的,一個悲觀的。
他認為六年足夠長,人類會找到利用AI技術(shù)的方法,創(chuàng)作出真正偉大的藝術(shù)作品。
Simon不認為GenAI用于藝術(shù)創(chuàng)作——如圖像、視頻和音樂——能像基于文本的LLM那樣,得到同等的尊重。
生成式藝術(shù)工具很有趣,但它們對輸出缺乏精細的控制。
這大大限制了它們的實用性,現(xiàn)在這些工具只能生成一些供個人消遣的內(nèi)容。
更重要的是,它們缺乏社會認同。整體社會氛圍上,大家對AI生成的藝術(shù)觀感不好。許多有才華的藝術(shù)家,強烈反對這些工具,甚至在社會中,「AI」這一術(shù)語也開始變成某種意義上的貶義詞。
圖像和視頻模型也是AI訓(xùn)練數(shù)據(jù)倫理爭論的核心,原因很簡單:未經(jīng)允許,沒有藝術(shù)家愿意看到他們的作品,被用來訓(xùn)練模型,然后這些模型反過來直接與他們競爭!
Simon認為六年的時間足夠讓這一切塵埃落定——讓社會找到真正提升人類表達方式的可行方法。
讓他興奮的是,真正有才華、有遠見、有創(chuàng)意的藝術(shù)家,將利用這六年內(nèi)演變出的工具,創(chuàng)作出有意義的藝術(shù)作品。而且這些工具不可或缺,否則這些藝術(shù)就不可能實現(xiàn)。
在播客中,Simon談到了《瞬息全宇宙》(Everything Everywhere All at Once),這部電影贏得了2023年七項奧斯卡獎項。
電影的視覺特效團隊,核心只有五個人。
試想如果能使用六年后才出現(xiàn)的GenAI工具,他們能做出什么樣的作品!

自從播客錄制以后,Simon從Swyx那里了解到,Runway ML已包含在《瞬息全宇宙》的工具集中:
Evan Halleck曾在這支團隊,他利用Runway的AI工具節(jié)省時間,自動化了編輯的繁瑣環(huán)節(jié)。特別是在電影的巖石場景中,他使用Runway的轉(zhuǎn)描機技術(shù)(rotoscoping)快速、干凈地剪輯巖石,同時沙子和灰塵在鏡頭周圍移動。這把原本需要幾天的工作縮短到了幾分鐘。
Simon在播客中預(yù)測,使用GenAI工具的電影,將在六年內(nèi)獲得奧斯卡獎。
這樣看來他已經(jīng)遲了八年!
六年后的反烏托邦:大規(guī)模社會動蕩
2031年的悲觀預(yù)測則是關(guān)于「AGI」的,AGI這個術(shù)語一直在不斷被重新定義。
此前就有報道,微軟和OpenAI現(xiàn)在將AGI定義為能夠創(chuàng)造1000億美元利潤的系統(tǒng)!
如果假設(shè)AGI能夠執(zhí)行目前人類承擔(dān)的幾乎全部的崗位,那么很難不看到潛在的負面后果。
奧特曼可能嘗試過全民基本收入。但美國現(xiàn)在連全民醫(yī)保問題都無法解決,更何況全民基本收入!

當大多數(shù)工作被機器取代時,很難想象未來的經(jīng)濟怎么能為大多數(shù)人服務(wù)。
所以,他為2031年做的悲觀預(yù)測是:如果這種形式的AGI到來,那么它將帶來極其糟糕的經(jīng)濟后果和大規(guī)模的社會動蕩。
他心目中的AI烏托邦是能夠增強當前人類能力的AI工具。
這正是迄今為止利用LLM所做的事。
他理想中的狀態(tài)是這些工具不斷改進,最終使人類能夠完成更加宏偉的工作。
如果有一種AGI能實現(xiàn)這種烏托邦,他愿意全力以赴。
作者介紹

Simon Willison是一位英國程序員,Lanyrd社交會議目錄的聯(lián)合創(chuàng)始人,以及Web框架Django的聯(lián)合創(chuàng)造者。
2010年末,他作為聯(lián)創(chuàng)推出了社交會議目錄Lanyrd,后被收購。
2019年-2020年,他在斯坦福大學(xué)擔(dān)任約翰·S·奈特研究員(JSK fellow),開始構(gòu)建服務(wù)于數(shù)據(jù)新聞學(xué)的、開源的工具生態(tài)系統(tǒng)。
從2002年,他開始堅持在個人博客上發(fā)表文章。


















