1年智能體落地，3年獲普利策獎，6年或引發(fā)危機！Django之父6大預(yù)測

作者：新智元 2025-02-05 07:30:00

人工智能新聞

AI發(fā)展日新月異，未來撲朔迷離。近日，Web框架Django之父Simon Willison，預(yù)測了未來1、3、6年不同階段的AI發(fā)展以及影響。

AI發(fā)展日新月異，可謂「亂花漸欲迷人眼」，很難預(yù)測未來的世界到底如何。

而Web框架Django之父Simon Willison，這一次他走出舒適區(qū)，大膽跨界預(yù)測未來AI發(fā)展趨勢！

在近日的播客中，他預(yù)測了未來1、3、6年不同階段的AI發(fā)展以及可能的結(jié)果。

參加完播客之后，Simon Willison把對未來的預(yù)測擴展為博客文章。

主要預(yù)測如下：

1. 一年內(nèi)，除了編程和科研智能體，其他智能體難以落地。

2. 三年內(nèi)，某人將在GenAI工具輔助下，拿下普利策獎;在日常工作，記者熟練利用LLM，處理數(shù)據(jù)；在個人數(shù)據(jù)保護上，法律取得實質(zhì)性進展。

3. 六年后，AI將簡化藝術(shù)創(chuàng)作，解放人類的藝術(shù)創(chuàng)意。但如果AGI取代大部分人類的工作，可能會引發(fā)大規(guī)模社會動蕩，后果不堪設(shè)想。

一年內(nèi)智能體預(yù)測：第一部分

在2024年，Simon評論到「智能體」還沒有真正發(fā)生。

Simon認為，在2025年將看到更多關(guān)于智能體的炒作，但結(jié)果將讓大多數(shù)「智能體」的粉絲感到失望。

在智能體（Agent）上，Simon預(yù)見將有大量資金被白白浪費。

「旅行智能體」不會成功

如果問十個人，你會得到十個稍微不同的答案——Simon收集并用AI總結(jié)了不同的答案。

鏈接：https://gist.github.com/simonw/beaa5f90133b30724c5cc1c4008d0654

為了簡化論證，Simon選了一個他認為不會實現(xiàn)的定義：可以代表用戶去半自主行動的AI助手。

Simon把這個定義稱為「旅行智能體」式的智能體，因為當描述「智能體」時，不知為何，人們總會聯(lián)想到預(yù)定航班、酒店以及規(guī)劃行程。

讓當前的LLM做出重要決策——比如花錢買什么——是一個非常糟糕的主意。

它們不可靠，但更重要的是，它們太容易受騙了。

如果你給AI助手一張信用卡，并放任它的行動，你要確保，在第一個聲稱提供最佳優(yōu)惠的網(wǎng)站上，它不會馬上點擊「購買」按鈕！

因為點擊一下「購買」，就能把你的銀行賬戶信息轉(zhuǎn)給黑客，從而掏空你的「錢包」。

而現(xiàn)在還無法避免這一點。

之所以還沒有看到LLM驅(qū)動的智能體，就是因為可靠性。

Simon對這點深信不疑，盡管自從ChatGPT首次發(fā)布以來，這個想法就吸引了大量關(guān)注。

接下來的12個月，發(fā)布的模型中，只要有一個能完全避免這一點，Simon都會喜出望外。

因為他認為解決受騙問題非常難，難得出奇。

一年內(nèi)：編程和科研智能體行得通

Simon相信有兩類「智能體」確實可行，而且事實已經(jīng)證明它們確實有效。

編程助手

第一類是編程助手——讓LLM寫代碼、執(zhí)行并根據(jù)結(jié)果修改代碼，不斷循環(huán)。

在2023年3月或4月，Simon第一次看到這種模式：OpenAI用Code Interpreter演示了這一點。

ChatGPT可以利用Python解決問題：它會編寫代碼，并在安全沙箱中（可能是Kubernetes）執(zhí)行代碼，然后根據(jù)輸出或錯誤信息判斷目標是否已達到。

這種模式非常好，在2023年初的模型（最初使用的是GPT-4）中效果非常好，今天依然如此。

在同年10月，Claude也發(fā)布了自己的版本（Claude Analysis，使用在瀏覽器中運行的JavaScript），Mistral和Gemini也有類似的功能，還有許多其他工具實現(xiàn)了相同的模式。

科研助手

第二類智能體是科研助手——LLM能夠多次搜索，收集信息，并將其整合成答案或者撰寫報告。

在這一領(lǐng)域，Perplexity和ChatGPT Search已經(jīng)運作了一段時間，但Simon印象最深刻的是Google Gemini的Deep Research工具。

比如，他向Deep Research提出這樣的問題：

Pillar Point Harbor是北美西海岸最大的棕色鵜鶘棲息地之一。
找到其他的棲息地。

Gemini會起草計劃，利用、谷歌搜索訪問幾十個網(wǎng)站，然后整合報告（并附上重要的引用），描述發(fā)現(xiàn)的內(nèi)容。

它給出的計劃是：

Pillar Point Harbor是北美西海岸最大的棕色鵜鶘棲息地之一。找到北美西海岸其他大的棕色鵜鶘棲息地。
1. 查找北美西海岸棕色鵜鶘棲息地的列表。
2. 查找關(guān)于棕色鵜鶘棲息地及其大小的研究論文或文章。
3. 查找來自鳥類觀察組織或政府機構(gòu)關(guān)于棕色鵜鶘棲息地的信息。
4. 將（3）中找到的棲息地大小與Pillar Point Harbor棲息地的大小進行比較。
5. 查找與棕色鵜鶘棲息地和其種群相關(guān)的新聞文章或最新報告。

它挖掘了大量的細節(jié)，包括2016-2019年太平洋棕色鵜鶘調(diào)查報告中的PDF文件，而Simon最關(guān)心的就是這些——其中包含的列表讓他很滿意：

十大超級棲息地（通常棲息超過500只鵜鶘的地方）：
- 阿拉米達防波堤（Alameda Breakwater），加利福尼亞州（3,183）
- 支柱點港（Pillar Point Harbor），加利福尼亞州（1,481）
- 東沙島（East Sand Island），俄勒岡州（1,121）
- 阿諾新月州立公園（Ano Nuevo State Park），加利福尼亞州（1,068）
- 薩利納斯河口（Salinas River mouth），加利福尼亞州（762）
- 博利納斯瀉湖（Bolinas Lagoon），加利福尼亞州（755）
- 莫羅巖（Morro Rock），加利福尼亞州（725）
- 莫斯蘭丁（Moss landing），加利福尼亞州（570）
- 克雷森特城港（Crescent City Harbor），加利福尼亞州（514）
- Tomales鳥巖（Bird Rock Tomales），加利福尼亞州（514）

Simon才知道，他所在的支柱點港（Pillar Point Harbor）是第二大棲息地！

對Simon來說，利用當前的LLM，完全可以自己構(gòu)建科研助手。

它們能夠驅(qū)動工具，能提出相對淺顯的研究計劃（尋找新聞文章和研究論文）。而且如果搜索并收集到適當?shù)纳舷挛模鼈兙湍芎铣珊侠淼拇鸢浮?/span>

Google尤其擅長此道：他們擁有全球最大的網(wǎng)站搜索索引，而且Gemini模型的上下文可以包含200萬token。

Simon預(yù)計Deep Research會越來越好，并且吸引來大量競爭者。

三年后：AI輔助拿下普利策獎

Simon做了一個有點自利（self-serving）的預(yù)測：認為三年之內(nèi)，有人將因由生成式AI工具輔助的調(diào)查報道而獲得普利策獎。

但并不是說LLM會寫這篇文章！

他依然認為，讓LLM代替人寫文章，是最無趣的應(yīng)用之一。

之所以稱這個預(yù)測是自利的，是因為Simon希望他能推動這一事件的發(fā)生！

他開源了數(shù)據(jù)新聞工具套件Datasette，還在不斷增加AI功能。

比如，利用LLM來數(shù)據(jù)增強；從非結(jié)構(gòu)化文本中，提取結(jié)構(gòu)化數(shù)據(jù)并轉(zhuǎn)化為表格。

他的夢想是這些工具——或者類似的工具——能夠被用于獲獎的調(diào)查報道。

他之所以選擇三年這個時間，就是因為讓人們普遍了解如何負責(zé)任地、有效地使用這些工具，并將應(yīng)用于實際工作，需要這么長時間。

LLM并不是新聞業(yè)的天然的契合點：記者尋求真相，而LLM通常容易產(chǎn)生幻覺，捏造事實。

但是，記者也非常擅長從不可信的來源中提取有用信息——這也是新聞工作的重要部分。

一下兩個領(lǐng)域，他認為LLM特別適合新聞業(yè)：

結(jié)構(gòu)化數(shù)據(jù)提取。如果利用《信息自由法》，成功獲得了1萬份PDF文件，那么需要有人或某些工具來閱讀這些文件，并找到暗藏的故事。而LLM非常擅長處理大量信息，并整理出有意義的內(nèi)容。它們可以生成線索，幫助找出值得深入調(diào)查的故事。
編程輔助。編寫代碼、分析數(shù)據(jù)是現(xiàn)代數(shù)據(jù)新聞的重要部分——從SQL查詢到數(shù)據(jù)清理腳本、定制網(wǎng)絡(luò)抓取工具或可視化工具，都可以幫助從雜亂的信息中找到有價值的信號。但大多數(shù)報社并沒有程序員團隊：Simon認為在三年內(nèi)，將圍繞這種模式構(gòu)建足夠強大的工具，能讓非程序員記者在報道過程輕松使用這些工具。

Simon希望他自己能夠開發(fā)這類工具！

所以他對未來三年的具體預(yù)測是：有人將憑借少量的LLM輔助贏得普利策獎。

更普遍的預(yù)測是：三年后，大多數(shù)專業(yè)消息人士將LLM作為日常工作流的一部分，而且使用方式也越來越復(fù)雜，但大家卻習(xí)以為常、熟視無睹。

三年后：隱私法將落地

另一個三年后的預(yù)測涉及隱私立法。

定向廣告和人們粘貼到模型的數(shù)據(jù)到底會發(fā)生什么，已經(jīng)引起了人們的杯弓蛇影（往往是有理由的），而且還在不斷增長。

Simon曾寫過，蘋果通過監(jiān)聽手機麥克風(fēng)來定向廣告，是「無法根除的陰謀論」。

過去，他也曾寫過關(guān)于AI信任危機的文章：許多人拒絕相信模型并不會基于他們的輸入數(shù)據(jù)進行訓(xùn)練，而且背后的公司已經(jīng)反復(fù)否認。

他認為，AI行業(yè)本身將從立法中受益匪淺，特別是在明確用戶提交數(shù)據(jù)訓(xùn)練方面，而更一般的科技行業(yè)，也亟需在數(shù)據(jù)保留和定向廣告等方面制定更嚴格的規(guī)則。

在未來四年，Simon不指望美國聯(lián)邦政府能通過相關(guān)立法，但預(yù)計，在州級或國際層面，會看到更多具有實際執(zhí)行力的隱私法規(guī)。

Simon希望不要因此產(chǎn)生新一代的cookie同意條款。

六年后的烏托邦：令人稱奇的藝術(shù)

對于六年后的預(yù)測，Simon選擇了兩個對立的預(yù)測，一個樂觀的，一個悲觀的。

他認為六年足夠長，人類會找到利用AI技術(shù)的方法，創(chuàng)作出真正偉大的藝術(shù)作品。

Simon不認為GenAI用于藝術(shù)創(chuàng)作——如圖像、視頻和音樂——能像基于文本的LLM那樣，得到同等的尊重。

生成式藝術(shù)工具很有趣，但它們對輸出缺乏精細的控制。

這大大限制了它們的實用性，現(xiàn)在這些工具只能生成一些供個人消遣的內(nèi)容。

更重要的是，它們缺乏社會認同。整體社會氛圍上，大家對AI生成的藝術(shù)觀感不好。許多有才華的藝術(shù)家，強烈反對這些工具，甚至在社會中，「AI」這一術(shù)語也開始變成某種意義上的貶義詞。

圖像和視頻模型也是AI訓(xùn)練數(shù)據(jù)倫理爭論的核心，原因很簡單：未經(jīng)允許，沒有藝術(shù)家愿意看到他們的作品，被用來訓(xùn)練模型，然后這些模型反過來直接與他們競爭！

Simon認為六年的時間足夠讓這一切塵埃落定——讓社會找到真正提升人類表達方式的可行方法。

讓他興奮的是，真正有才華、有遠見、有創(chuàng)意的藝術(shù)家，將利用這六年內(nèi)演變出的工具，創(chuàng)作出有意義的藝術(shù)作品。而且這些工具不可或缺，否則這些藝術(shù)就不可能實現(xiàn)。

在播客中，Simon談到了《瞬息全宇宙》（Everything Everywhere All at Once），這部電影贏得了2023年七項奧斯卡獎項。

電影的視覺特效團隊，核心只有五個人。

試想如果能使用六年后才出現(xiàn)的GenAI工具，他們能做出什么樣的作品！

自從播客錄制以后，Simon從Swyx那里了解到，Runway ML已包含在《瞬息全宇宙》的工具集中：

Evan Halleck曾在這支團隊，他利用Runway的AI工具節(jié)省時間，自動化了編輯的繁瑣環(huán)節(jié)。特別是在電影的巖石場景中，他使用Runway的轉(zhuǎn)描機技術(shù)（rotoscoping）快速、干凈地剪輯巖石，同時沙子和灰塵在鏡頭周圍移動。這把原本需要幾天的工作縮短到了幾分鐘。

Simon在播客中預(yù)測，使用GenAI工具的電影，將在六年內(nèi)獲得奧斯卡獎。

這樣看來他已經(jīng)遲了八年！

六年后的反烏托邦：大規(guī)模社會動蕩

2031年的悲觀預(yù)測則是關(guān)于「AGI」的，AGI這個術(shù)語一直在不斷被重新定義。

此前就有報道，微軟和OpenAI現(xiàn)在將AGI定義為能夠創(chuàng)造1000億美元利潤的系統(tǒng)！

如果假設(shè)AGI能夠執(zhí)行目前人類承擔(dān)的幾乎全部的崗位，那么很難不看到潛在的負面后果。

奧特曼可能嘗試過全民基本收入。但美國現(xiàn)在連全民醫(yī)保問題都無法解決，更何況全民基本收入！

當大多數(shù)工作被機器取代時，很難想象未來的經(jīng)濟怎么能為大多數(shù)人服務(wù)。

所以，他為2031年做的悲觀預(yù)測是：如果這種形式的AGI到來，那么它將帶來極其糟糕的經(jīng)濟后果和大規(guī)模的社會動蕩。

他心目中的AI烏托邦是能夠增強當前人類能力的AI工具。

這正是迄今為止利用LLM所做的事。

他理想中的狀態(tài)是這些工具不斷改進，最終使人類能夠完成更加宏偉的工作。

如果有一種AGI能實現(xiàn)這種烏托邦，他愿意全力以赴。

作者介紹

Simon Willison是一位英國程序員，Lanyrd社交會議目錄的聯(lián)合創(chuàng)始人，以及Web框架Django的聯(lián)合創(chuàng)造者。

2010年末，他作為聯(lián)創(chuàng)推出了社交會議目錄Lanyrd，后被收購。

2019年-2020年，他在斯坦福大學(xué)擔(dān)任約翰·S·奈特研究員（JSK fellow），開始構(gòu)建服務(wù)于數(shù)據(jù)新聞學(xué)的、開源的工具生態(tài)系統(tǒng)。

從2002年，他開始堅持在個人博客上發(fā)表文章。

責(zé)任編輯：張燕妮來源：新智元

模型算力 AI