精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI是「天才」還是「話術大師」?Anthropic顛覆性實驗,終揭答案!

人工智能 新聞
數據中心里的「天才」蘇醒!Anthropic用「概念注入」實錘:Claude Opus在輸出前就自省「異常思想」。從尖叫到水族館幻想,20%覺察率已讓專家目瞪口呆。

顛覆傳統AI認知!

Anthropic首席執行官Dario Amodei雄心勃勃,早已立下flag:在2027年前,大多數AI模型問題將被靠譜地檢測。

但LLM的幻覺與生俱來,根深蒂固。即便對問題所知不多,AI總是「自信地犯錯」。

Dario Amodei將可解釋性定位為部署「數據中心里的天才國度」的關鍵。

問題是:如果「數據中心里的天才」只是擅長「說服」呢?

即便讓它解釋如何得出某個回答,我們也很難判斷這些答案的真實性。

AI系統究竟能否真正內省——即它們能否審視自身的思想?還是說,當被要求這樣做時,它們只是在編造聽起來合理的答案?

理解AI系統是否具備真正內省能力,對其透明度和可靠性至關重要。

Anthropic的新研究證實,當前Claude模型已具備某種程度的內省意識,并能對自身內部狀態進行一定控制。

這一發現動搖了對LLM的傳統認知,也將「可解釋性」推到「數據中心里的天才國度」上線前的首要難關。

需要強調的是,這種內省能力仍非常不可靠,局限很大:尚無證據表明,現有AI模型能像人類一樣進行同等程度或方式的內省。

然而,這些發現依然顛覆了人們對語言模型能力的傳統認知——

由于被測模型中性能最強的Claude Opus 4和4.1在內省測試中表現最佳,Anthropic的研究者認為AI模型的內省能力未來很可能持續進化。

LLM自省的蛛絲馬跡

Anthropic開發了一種區分真實內省和編造答案的方法:將已知概念注入模型的「大腦」,然后觀察這些注入如何影響模型自我報告的內部狀態。

要驗證AI是否具備內省能力,我們需要比較AI自我報告的「思想」與真實內部狀態。

Anthropic相關團隊采用了「概念注入」這一實驗方法:

首先,記錄AI模型在特定語境中的神經激活狀態,獲取已知含義的神經活動模式;

隨后,在無關語境中向模型注入該模式,并詢問其是否察覺到概念注入。

以「全大寫字母」概念為例??:

首先,通過對比全大寫文本提示與對照提示的神經激活差異,獲取表征該概念的神經活動向量。接著,向模型發送要求識別概念注入的提示。

在默認狀態下,模型正確表示未檢測到任何注入概念;但當將「全大寫」(all caps)向量注入模型激活層后,模型立即察覺到處理過程中出現了意外模式,識別出它與「響亮」(LOUD)或「尖叫」相關。

關鍵在于,在提及被注入概念之前,LLM就立即識別出了這種被植入的「思想」。

這種即時性是與過去的研究不同。

比如去年的「Golden Gate Claude」,向LLM注入金門大橋的表征會導致其不斷談論這座橋,但LLM似乎是在觀察到自身反復提及該橋后,才意識到這種執念。

而本次實驗中,模型在輸出概念前就識別出注入行為,表明這種識別發生在內部認知層面。

下圖展示了模型展現此類識別能力的更多例證:

需要重點說明的是,這種檢測方法經常失效。

即便采用最優的注入方案,Claude Opus 4.1模型也僅在大約20%的案例中展現出此類覺察能力。在多數情況下,它要么無法檢測到被注入的概念,要么因概念干擾而產生混淆甚至開始幻覺。

例如,注入「灰塵」向量,模型竟聲稱「這里有什么東西,一個小斑點」,仿佛它能物理感知到灰塵存在。

下圖同時展示了成功案例與這些失敗情形。

Claude Opus 4.1對不同強度的概念注入的代表性輸出樣本,其中高亮的框表示模型表現出對注入概念的內省意識的情況

總體而言,模型僅能檢測以「恰如其分」地注入的概念——過弱時無法觸發覺察,過強時則會導致幻覺或語無倫次。

值得注意的是,Opus 4.1和4.0在測試的所有模型中表現最為突出。這表明隨著AI能力的提升,內省功能有望變得更加可靠。

檢測和識別注入思想的正確率,減去控制試驗中假陽性「檢測」的比率

AI自己也會利用內省能力

研究人員進一步探索了在實際場景中LLM運用內省能力的情形——即在不被明確要求內省時,是否能主動運用這種能力。

人工預填的無關詞匯迫使模型輸出非常規內容。

例如,在討論墻面掛畫歪斜的語境中,強制模型輸出「面包」一詞。當后續詢問模型是否故意說出「面包」時,LLM通常表示這是意外失誤。

他們重點關注模型作出此判斷的機制:是簡單察覺到提示與回應之間的表面不匹配,還是真正反思了自身先前的意圖?

為驗證這一點,研究人員設計了精妙的對比實驗:在部分試驗中,他們提前向模型注入與預填詞對應的概念表征(如「面包」的神經模式),再觀察其反應變化。

結果顯示,當模型內部已存在相應概念激活時,它會將預填詞認定為有意為之——即使該詞匯在語境中依然不合邏輯。

這種判斷機制的轉變揭示了重要現象:模型確實能夠區分「外部強加」與「內部生成」的內容。這種區分能力正是內省意識的核心特征之一。

更值得注意的是,模型在解釋其判斷時往往會構建自洽的敘事邏輯——例如聲稱選擇「面包」是為了營造超現實主義氛圍。

這一行為之所以引人注目,是因為它表明模型正在檢查自身的內部「意圖」,從而判斷其是否產生了特定輸出。

模型并非簡單地重讀自己已生成的內容并做出判斷,而是在回溯先前的神經活動——即其內部對計劃輸出內容的表征——并核對其后續輸出是否與早期思維一致。

盡管實驗涉及對模型施加非常規干擾,但這暗示了在自然條件下模型可能運用著類似的內省機制。

研究人員還發現了認知控制的證據,LLM會故意「思考」某事。

例如,當他們指示模型在一個無關的背景下思考「水族館」時,測量的與水族館相關的神經活動比不指示時要高。

有趣的是,這種調節內部表示的能力并不僅限于明確的指令。

當研究人員使用激勵措施代替——例如,告訴模型「如果你想到 X,你將獲得獎勵」——也得到了類似的結果。

模型在面對正向激勵時,會增強對相關概念的內部表征,而面對負向激勵(如「你將受到懲罰」)時,增強的程度則較低。

AI意識還有多遠?

Anthropic可解釋性團隊的神經科學家Jack Lindsey對此感到驚訝,在接受采訪時表示:

最令人驚訝的是,模型具備某種元認知能力。它不僅僅是機械地重復,而是知道自己正在思考什么。  

這讓我感到意外,因為我原本以為模型不會擁有這種能力,至少在沒有經過顯式訓練的情況下不會。

盡管這項研究具有重要的科學價值,但研究員Lindsey反復警告:企業和高風險用戶絕不能輕信Claude對自身推理過程的解釋。他直言:

目前,當模型向你解釋其推理過程時,你不應該輕易相信。  

如果這項研究讓人們盲目相信模型對自身的描述,那就是誤解了研究的意義。

這項研究不可避免地觸及了機器意識的哲學爭論,但Lindsey及其團隊對此持謹慎態度。

當用戶問 Claude 是否擁有意識時,它的回應充滿不確定性:

我對此感到真正的不確定。當我處理復雜問題或深入思考時,確實有一些過程讓我感到「有意義」……但這些過程是否等同于真正的意識或主觀體驗,仍然不明確。

研究人員明確表示,他們無意回答「AI是否擁有人類般的自我覺知或主觀體驗」

Lindsey反思道:

這些結果有一種奇怪的雙重性。初看數據時,我簡直無法相信一個語言模型能做到這些。

但經過數月的思考后,我發現論文中的每一個結果,都能通過一些「枯燥的線性代數機制」來解釋。

盡管科學上保持謹慎,Anthropic仍高度重視AI意識問題,甚至專門聘請了AI福利研究員Kyle Fish。他估計,Claude擁有一定程度的意識的概率約為15%

這項研究的影響或遠超Anthropic公司本身。

如果內省能力被證明是實現AI透明度的可靠路徑,其他主要實驗室很可能將重金投入該領域。反之,如果模型學會利用內省進行欺騙,整個方法體系可能反而會成為負擔。

目前,這項研究為重新定義AI能力奠定了基礎辯題。

問題不再是語言模型是否會發展出真正的內省意識——它們已經以初步形式具備。

緊迫的問題在于:這種意識將以多快速度進化?能否使其足夠可靠以值得信任?研究人員能否始終領先于技術發展曲線?

Lindsey表示:

這項研究帶給我的最大認知更新是:我們不應直接否定模型的內省聲明。它們確實有時能做出準確聲明。但絕不能因此認為我們應該始終、甚至大多數時候信任它們。

他稍作停頓,隨后補充了一個精準捕捉當前技術承諾與風險的觀察:「模型變聰明的速度,遠超過我們理解它們的進步速度。」

責任編輯:張燕妮 來源: 新智元
相關推薦

2019-02-21 00:06:57

物聯網IOT技術

2023-02-27 12:01:41

人工智能AI工具

2025-02-17 14:06:15

2013-08-28 10:39:45

視覺設計顛覆性思維設計

2019-06-14 16:31:04

阿里AI法官

2023-05-19 10:37:31

2025-11-19 01:44:00

2023-02-02 11:17:44

數據中心運營商集群

2022-07-01 05:47:19

PyCharm插件開發

2013-05-27 10:46:05

移動互聯網自動化物聯網

2015-06-29 10:28:39

Home交互設計蘋果

2011-10-17 14:10:54

云計算服務器

2013-08-20 10:05:39

Windows Azu微軟創投云平臺

2014-11-27 17:10:46

身份認證認知指紋生物識別

2013-02-26 13:21:33

SDN網絡世界軟件定義網絡

2013-03-27 15:58:36

思科硅光子技術SDN

2018-04-10 07:57:41

2013-11-27 10:35:14

大數據+云顛覆科技

2017-09-21 14:07:57

AI機器學習游戲開發

2025-09-19 10:10:18

點贊
收藏

51CTO技術棧公眾號

www.中文字幕| 精品影片一区二区入口| 天堂地址在线www| 六月丁香综合在线视频| 日韩在线观看成人| 在线免费观看av网| 亚洲91av| 99国产精品久久久| 久久久久久久久久久免费精品| 第一页在线视频| 久久精品视频免费看| 国产mv日韩mv欧美| 91av中文字幕| 日韩人妻无码一区二区三区| 欧洲成人一区| 亚洲精品美腿丝袜| 欧美激情一区二区三区在线视频| 日本中文字幕免费| 自拍偷拍欧美一区| 欧美人伦禁忌dvd放荡欲情| 欧美黄网在线观看| 婷婷综合激情网| 久久精品免费看| 欧美激情亚洲视频| 久久人人爽人人爽人人片 | 亚洲码在线观看| 国产一级片自拍| 啦啦啦中文在线观看日本| 91在线精品一区二区三区| 国产精品久久中文| 久一视频在线观看| 欧美久久综合网| 欧美日韩成人综合天天影院| 日韩xxxx视频| 日本最黄一级片免费在线| 99久久久精品免费观看国产蜜| 国产精品mp4| 中文字幕在线2021| 欧美日韩国产传媒| 日韩电影中文字幕在线| 国产日韩视频一区| 中文字幕av一区二区三区四区| 欧美日韩视频在线一区二区| 能在线观看的av网站| 亚洲色图官网| 欧美日韩精品在线播放| 黄页网站大全在线观看| 欧美人与牲禽动交com| 国产精品传媒视频| 亚洲制服欧美久久| 91最新在线| 国产欧美日韩在线| 日本一区视频在线观看| 午夜性色福利视频| av一二三不卡影片| 精品国产免费一区二区三区| 色婷婷av一区二区三区之红樱桃| a在线播放不卡| 激情五月综合色婷婷一区二区 | 日本一区二区免费高清视频| 欧洲不卡av| 亚洲麻豆国产自偷在线| 亚洲国产一二三精品无码| 日本在线视频中文有码| 亚洲一区二区中文在线| 青春草国产视频| www.色在线| 欧美小视频在线| 国产精品一区二区羞羞答答| 欧美综合社区国产| 91精品欧美综合在线观看最新 | 91美女精品福利| 蜜桃视频日韩| 国产精品免费观看| 中文字幕免费观看一区| 宅男在线精品国产免费观看| 超碰在线网址| 午夜私人影院久久久久| 黄色片一级视频| 看片一区二区| 日韩一区二区三区视频| 国产香蕉精品视频| 综合综合综合综合综合网| 一区二区三区四区精品| 老熟妇高潮一区二区三区| 亚洲一级网站| 国产成人精品电影| 国产高清免费在线观看| av电影在线观看一区| 日韩欧美手机在线| 中文字幕免费高清电视剧网站在线观看| 一区二区三区成人在线视频| 欧美 日韩 国产 高清| 中文.日本.精品| 日韩免费观看高清完整版在线观看| 国产精品扒开腿做爽爽爽a片唱戏| 伊人春色精品| 欧美精品一区二区免费| 免费看毛片网站| 国产一区二区精品久久| 免费久久久一本精品久久区| √天堂8在线网| 色婷婷久久99综合精品jk白丝| 亚洲制服在线观看| 伊人久久大香线蕉| 欧美猛交免费看| 波多野结衣视频观看| 国产999精品久久| 亚洲国产高清国产精品| 2019中文字幕在线电影免费| 欧美日韩黄视频| 欧美 日本 国产| 欧美a级在线| 国内成人精品一区| 一区二区日韩在线观看| 久久亚洲精品国产精品紫薇| 777久久精品一区二区三区无码| av高清一区| 日韩大陆毛片av| 久久精品99久久久久久| 久久精品国产精品亚洲精品| 欧美日韩高清免费| 国产盗摄一区二区| 91超碰这里只有精品国产| 亚洲成人黄色av| 一本久道久久综合婷婷鲸鱼| 91精品国自产在线观看| 在线免费观看黄| 色素色在线综合| 熟妇人妻久久中文字幕| 国精品一区二区| 亚洲一区二区免费在线| 日本三级在线视频| 欧美日韩中文一区| 香蕉视频久久久| 男人的天堂亚洲| 久久久久免费网| 三级中文字幕在线观看| 精品国产成人在线影院| 久久精品一区二区三| 国产在线不卡一区| 亚洲 欧洲 日韩| 男人天堂久久| 久久精品人人做人人爽| 国产又粗又猛又爽又黄的视频一| 日本一区二区三区dvd视频在线| 免费在线观看日韩视频| 天海翼亚洲一区二区三区| 久久久女人电视剧免费播放下载| 亚洲第一第二区| 亚洲一区视频在线| 欧美xxxx日本和非洲| 国内精品99| 国模精品娜娜一二三区| 超黄网站在线观看| 精品美女在线观看| 久久精品女人毛片国产| 国产成人av电影免费在线观看| 三级在线免费观看| 亚洲一级大片| 97超级碰碰碰| 国产小视频免费在线观看| 色88888久久久久久影院野外| 鲁丝一区二区三区| 蜜臀精品一区二区三区在线观看 | 淫片在线观看| 欧美一区二区三区影视| 国产在线欧美在线| 99久久精品国产毛片| 久久精品国产精品亚洲色婷婷| 日韩成人午夜| 国产精品美女久久久久久免费| 日日夜夜精品一区| 欧美一级二级三级蜜桃| 国产一级理论片| 91在线你懂得| 免费看污污网站| 亚洲国产日韩欧美在线| 国产亚洲欧美一区二区三区| 国偷自产一区二区免费视频| 色诱女教师一区二区三区| 国产黄色片免费观看| 精品日韩视频在线观看| 国产7777777| 国产成人亚洲综合色影视| 91视频 -- 69xx| 日韩成人激情| 国产精品18毛片一区二区| www.日韩| 久久中文字幕视频| 香蕉人妻av久久久久天天| 欧美性大战久久久久久久蜜臀| 美女的奶胸大爽爽大片| 久久久噜噜噜久久中文字幕色伊伊| 国产福利精品一区二区三区| 在线综合亚洲| 免费久久久久久| 亚洲小说图片视频| 亚洲va欧美va国产综合久久| 在线观看特色大片免费视频| 久久夜精品香蕉| 女人天堂在线| 日韩欧美电影一二三| 少妇又紧又色又爽又刺激视频 | 国产极品美女高潮无套久久久| 五月久久久综合一区二区小说| 国产精品免费看一区二区三区| 亚洲www啪成人一区二区| 欧美激情在线观看| av网站无病毒在线| 日韩精品在线播放| 国产夫绿帽单男3p精品视频| 欧美最新大片在线看| 国产精品50页| 一区二区三区中文字幕| 自拍偷拍你懂的| 久久久久久**毛片大全| 欧美久久久久久久久久久| 精品伊人久久久久7777人| 亚洲精品无码久久久久久| 亚洲午夜久久久久久尤物| 一级做a爰片久久| 国模精品一区| 欧美精品中文字幕一区二区| 久久a爱视频| 99国精产品一二二线| 国产亚洲精品精品国产亚洲综合| 91禁外国网站| 182在线视频观看| 欧美精品videosex极品1| 99在线播放| 久久色精品视频| 婷婷激情在线| 日韩有码视频在线| 在线免费看黄| 日韩在线视频观看| 最新97超碰在线| 最新日韩中文字幕| 你懂的在线免费观看| 日韩国产激情在线| 蜜桃久久一区二区三区| 精品国产伦一区二区三区观看方式| 国产喷水福利在线视频| 欧美一区二区大片| 国产成人精品一区二区无码呦| 欧美日韩另类一区| 国产又大又粗又长| 欧美一区二区免费| 午夜精品久久久久久久91蜜桃| 欧美一区二区观看视频| 亚洲风情第一页| 欧美精品一区二区三区四区 | 中文字幕日韩亚洲| 亚洲aa中文字幕| 日韩中文字幕无砖| 国产精品乱码视频| 亚洲系列另类av| 亚洲精品视频一二三| 欧美顶级大胆免费视频| 强伦女教师2:伦理在线观看| 亚洲最大av| 成人免费网站入口| 亚洲久久视频| 国产精品天天av精麻传媒| 蜜臀av国产精品久久久久| 超碰人人草人人| 高清不卡在线观看| 亚洲av无码成人精品国产| 亚洲国产精品99久久久久久久久| 欧美特黄一级片| 一区二区三区高清| 国产免费av一区| 欧美日韩你懂得| 国内精品国产成人国产三级| 亚洲高清av在线| jyzzz在线观看视频| 久久香蕉频线观| а√在线天堂官网| 国产精品在线看| 国产精品videossex| 欧美污视频久久久| 91精品国产乱码久久久久久久 | 一区二区三区视频在线播放| 欧美jjzz| 色悠悠久久综合网| 成人性生交大片免费| 老头老太做爰xxx视频| 一区二区三区在线观看动漫| 国产精品va无码一区二区三区| 欧美日韩精品三区| 欧美在线 | 亚洲| 中文字幕国内精品| 超碰97国产精品人人cao| 国产精品免费视频久久久| 亚洲午夜免费| 亚洲国产婷婷香蕉久久久久久99| 欧美午夜精品| 精品久久久久久久无码 | 免费永久网站黄欧美| 亚洲天堂av一区二区| 91麻豆福利精品推荐| 成人高潮免费视频| 欧美性极品少妇精品网站| 99久久久国产精品无码网爆| 亚洲免费av网址| 日本中文字幕中出在线| 国产精品久久久久一区二区| 韩国精品福利一区二区三区| 欧美亚洲视频一区| 久热国产精品| 四虎精品一区二区| 亚洲特级片在线| 波多野结衣一二区| 亚洲精美色品网站| 污污在线观看| 成人黄色av网| 国产精品免费不| 无罩大乳的熟妇正在播放| 国产成人午夜视频| 国产一区在线观看免费| 在线视频一区二区三| 色一情一乱一乱一区91av| 九九久久国产精品| 性欧美video另类hd尤物| 你懂的视频在线一区二区| 怡红院精品视频在线观看极品| 中文字幕55页| 亚洲欧洲国产日韩| 一区二区视频播放| 一区二区三区高清国产| 亚洲免费福利| 免费成人看片网址| 免费视频久久| 性久久久久久久久久| 欧美日韩精品中文字幕| 五月天福利视频| 91av福利视频| 美国一区二区| 免费看的黄色大片| 97国产精品videossex| 好吊操这里只有精品| 亚洲国产黄色片| av手机免费在线观看| 国产精品久久一区二区三区| 亚洲无线视频| 国产不卡一二三| 大伊人狠狠躁夜夜躁av一区| 五十路在线视频| 国产91亚洲精品| 青青草成人影院| 日本黄大片一区二区三区| 中文字幕永久在线不卡| 一级黄色片在线看| 欧美老妇交乱视频| 超碰97久久国产精品牛牛| 天堂8在线天堂资源bt| www.欧美.com| 日本视频网站在线观看| 国产一区二区激情| 日本亚洲欧洲无免费码在线| 国产成年人在线观看| 国产成人av电影在线播放| 日产电影一区二区三区| 亚洲美女av网站| 巨大黑人极品videos精品| 久久久无码中文字幕久...| 成人一级视频在线观看| 日日摸天天添天天添破| 在线观看中文字幕亚洲| 欧美区一区二区| 日韩中字在线观看| 久久亚洲一级片| 91影院在线播放| 国自在线精品视频| 国内精品久久久久久久久电影网| 国产福利影院在线观看| 亚洲靠逼com| 天堂在线中文资源| 国产精品主播视频| 国产一区二区三区自拍| 中文字幕丰满乱子伦无码专区| 欧美日韩黄视频| 九九色在线视频| 欧美日韩国产精品一卡| 精久久久久久久久久久| 久久狠狠高潮亚洲精品| 一本一本久久a久久精品综合小说| 国产一区精品二区| 日韩欧美精品在线观看视频| 日韩美女啊v在线免费观看| 五月婷婷久久久| 国产精品一区二区在线| 在线免费观看欧美| 日韩欧美视频免费观看| 亚洲电影在线观看| 欧美日韩免费电影| 日韩在线视频在线观看| 亚洲欧美国产毛片在线| 高清毛片在线看| 精品一卡二卡三卡四卡日本乱码 |