精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

開箱黑盒LLM!谷歌大一統框架Patchscopes實戰教程來了

人工智能 新聞
大模型最為人詬病的問題就是不透明、不可解釋。谷歌的最新框架Patchscopes可以提供關于模型內部隱藏表征的自然語言解釋,本文介紹了一些實戰應用樣例。

雖然大型語言模型(LLM)在各種常見的自然語言處理任務中展現出了優異的性能,但隨之而來的幻覺,也揭示了模型在真實性和透明度上仍然存在問題。

在模型生成錯誤回復內容時,如果能夠「深入理解其背后運行機制」,或許可以解決模型的幻覺問題。

然而,隨著深度神經網絡的復雜性和規模的增長,模型的「可解釋研究」也越來越有挑戰性,通過探索機器學習(ML)模型對所學內容(模型的所謂隱藏表示)進行表征的方式,即隱藏表征(hidden representation),研究人員可以在一定程度上控制模型的行為,并對模型的實際運行方式進行更深入的科學理解。

從過去的研究結果來看,一個相對有前景的方向是「使用LLMs來解釋其他模型的神經元模式」(neuron patterns)。

今年1月,Google Research和特拉維夫大學的研究人員共同提出了一個統一的框架Patchscopes來研究LLMs中的隱藏表征,主要思路就是使用LLMs來提供有關模型本身內部隱藏表征的自然語言解釋。

論文鏈接:https://arxiv.org/pdf/2401.06102.pdf

Patchscopes統一并擴展了現有的可解釋性技術,能夠讓模型回答出之前無法解決的問題,比如模型可以說出關于「LLM的隱藏表征如何捕捉模型輸入中含義的細微差別」的見解和想法,從而幫助開發人員更容易地修復某些特定類型的推理錯誤。

在論文剛發布的時候,研究人員還只是將Patchscopes的應用場景集中在自然語言處理領域和自回歸Transformer模型家族中,但實際上該方法的潛在應用范圍更廣。

最近,研究人員又發布了一篇博客,詳細介紹了該方法在檢測和糾正模型幻覺、探索多模態(圖像和文本)表征以及研究模型如何在更復雜的場景中構建預測方面的應用樣例。

Patchscopes使用方法

以NLP中常見的「實體共同指代解析」(co-references to entities)任務為例,首先需要在Patchscopes中實現一個專門用于解決共指問題的工具。

比如說,為了研究模型對代詞「it」所指代的人物上下文是如何理解的,需要創建出一套Patchscopes配置。


圖片

Patchscopes框架圖解,通過使用預定義的目標提示符(右)解碼源提示符(左)中「It」表征中編碼的內容。

1. 設置 Setup

給定一個目標模型后,需要輸入一段包含相關上下文信息的標準提示(即源提示,source prompt),如“Patchscopes is robust. It helps interpret…"(Patchscopes是穩健的,有助于解釋…)

2. 目標 Target

二級提示(secondary prompt 即 target prompt)的目的是提取特定的隱藏信息,在這個例子里,一個簡單的單詞重復提示就可以揭示出隱藏表征中的信息。

例子中的目標提示詞是cat->cat; 135->135; hello->hello; ?,但需要注意的是,提示中的單詞是隨機選擇的,所以可能看起來和輸入文本不相關,但也需要遵循特定的編寫模式:包含多個例子,其中每個樣例包括一個單詞、一個箭頭以及對該單詞的重復。

如果將文本輸入到一個訓練后的語言模型中來預測下一個單詞,模型的預期輸出為能夠繼續遵循該模式。

換句話說,如果模型把「?」中的內容與其他隨機單詞進行替換,讓模型生成下一個單詞,以此來考察模型應該重復哪些單詞?

3. 塊 Patch

在源提示符上執行推理(inference),其中「It」token中感興趣層的隱藏表征(圖中的綠色點)被注入到目標提示(圖中的橙色點)上,可以應用transformation(示例中的f函數)將表征與其他層或模型對齊。

4. 揭示 Reveal

對于增強后的輸入(augmented input),模型會在輸出中包含原始模型是如何在特定上下文中在內部對單詞「It」進行擴展的想法。

給出的例子中,模型生成了「Patchscopes」,解釋了在「It」token之上的模型第四層的隱藏表征,結果表明,經過4層計算后,模型已經將來自先前單詞的信息合并到「It」token上方的隱藏表征中,并得出結論,其不再指代通用對象,而是指代「Patchscopes」。

雖然token表征(綠色點)可能看起來像一個沒有任何含義解的浮點數向量,但Patchscopes框架可以將其轉換為人類可理解的文本,表明指代的是「Patchscopes」,與先前的工作一致,即關于一個主題的信息會在其最后一個token中累積。

Patchscopes實戰

Patchscopes在理解和控制LLMs方面有廣泛的應用。

1. 下一個token預測(next token prediction)

在計算過程中,根據給定的上下文,模型可以「多早地」得出最終預測?

從中間隱藏表示進行的token預測是一個常見的、可用于評估查看Transformer內部的可解釋性方法。

即使是在更復雜的早期或中期處理層,Patchscope的效果也非常好:在不同的語言模型中,從第10層開始,其性能都優于之前的方法,如Tuned Lens和Logit Lens。

使用來自LLM的中間隱藏表征的下一個token預測任務來評估各種可解釋性方法,展現了使用一個簡單的「Token Identity」目標提示符(即,由k個表示類似于標識的函數的演示組成的目標提示符,格式為「tok_1 → tok_1 ; tok_2 → tok_2 ; ... ; tok_k」)與Tuned Lens和Logit Lens方法相比。x軸是在LLM中檢查的隱藏表征層;y軸顯示precision@1,測量最高概率預測token匹配原始分布中最高概率token示例的比例。

2. 提取事實(pulling out facts)

在模型的計算中,可以多早獲取屬性信息(例如,某個國家的貨幣)。

在這個實驗中,研究人員主要考慮從文本中提取屬性的任務,文本來源為Hernandez等人(2024年)編寫的常識和事實知識任務。

論文鏈接:https://openreview.net/pdf?id=w7LU2s14kE

使用的目標提示主要針對簡單的動詞化關系,其次是一個占位符的主題。例如,要從「States」的表征中提取美國的官方貨幣,使用目標提示符「The official currency of x」,考慮到Patchscopes應用程序不使用任何訓練示例,并且明顯優于其他技術。

跨源層的屬性提取準確性(Attribute extraction accuracy across source layers,簡寫為REQ)。左:工具完成的任務(常識),54個源提示,12個類。右:國家貨幣(事實),83個來源提示,14個類別。

3. 解釋實體:不只用yes或no

模型在處理輸入時如何理解像「亞歷山大大帝」(Alexander the Great)這樣的多詞輸入?

Patchscopes超越了簡單的「它已經解決了這個問題」(has it figured this out yet)的答案,揭示了模型如何從開始階段,逐漸理解一個實體。

使用以下few-shot的目標提示來解碼模型的逐步處理:「敘利亞:中東國家,列奧納多迪卡普里奧:美國演員,三星:韓國跨國大型家電和消費電子公司,x」(Syria: Country in the Middle East, Leonardo DiCaprio: American actor, Samsung: South Korean multinational major appliance and consumer electronics corporation, x)。

當遍歷兩個不同模型(Vicuna-13 B和Pythia-12 B)的層時,更多來自上下文的單詞被整合到當前表征并反映在生成中。

通過定性實例說明實體解析:表達性的生成表明,當通過層時,更多來自上下文的tokens被集成到當前表征中。「解釋」(Explanation)指的是生成與源提示詞的關系。兩個示例都使用了上述相同的目標提示符。

4. 團隊合作:用模型解釋模型

Patchscopes框架可以使用強大的語言模型來解碼較小的過程:研究人員利用Vicuna-13 B來解釋Vicuna-7 B的輸入處理,將隱藏的實體表征從較小的模型修補到較大的模型中,然后測量模型生成的文本和來自維基百科的實際參考描述之間的詞匯相似性(使用RougeL得分)。

Vicuna-7 B → 13 B(綠色線)幾乎總是高于Vicuna-7 B → 7 B(藍線),曲線下面積更大,結果表明,跨模型修補到一個更大的和更有表現力的模型,在改進的生成和參考文本之間的詞匯相似性的結果,并表明跨模型修補的過程顯著增強了模型的能力,生成文本的上下文對齊的輸入表示從另一個模型。

使用Vicuna模型,生成的描述與維基百科的描述的RougeL(詞匯相似性)得分,從Vicuna-7 B到Vicuna-13 B的patched表征導致對popular和rare實體解析以更具表達力的語言化。

5. 修復錯誤推理

雖然最先進的LLMs可以獨立地解決每個推理步驟,但仍然很難實現多步推理。

Patchscopes可以通過重新路由中間隱藏表征來幫助解決這個問題,從而顯著提高準確性:在實驗中,系統地生成多跳的事實和常識推理查詢,并表明,與輸入結構的先驗知識,錯誤可以通過修補隱藏表征從查詢的一部分到另一個固定。

思維鏈(CoT)Pathcscope使用相同的源提示和目標提示來執行順序推理,但將一個位置的隱藏表征修補到另一個位置。

CoT Patchscope將準確率從19.57%提高到50%,本實驗的目的是證明使用Patchscopes進行干預和糾正是可行的,但要注意CoT Pathscope是一種說明,而不是一種通用的糾正方法。

責任編輯:張燕妮 來源: 新智元
相關推薦

2025-07-17 10:33:53

2023-03-13 13:40:20

機器學習AI

2025-06-09 09:50:00

VeactReact

2017-12-15 17:14:10

云端

2024-03-20 09:29:41

2015-05-06 13:52:52

微軟外媒

2020-12-13 13:40:22

健康碼移動應用

2015-07-30 12:27:30

重郵華為

2014-07-29 13:25:43

WWDC 2014 S

2012-02-28 09:54:01

Windows 8微軟賬戶

2023-07-17 08:03:03

Shell腳本SQL

2022-11-29 15:15:47

AI模型

2022-05-16 11:06:54

SOTA谷歌預訓練

2023-07-22 13:17:33

人工智能框架

2024-03-04 00:45:00

視頻訓練

2025-08-07 09:00:00

2025-03-13 10:18:42

2024-12-10 09:49:53

2017-06-27 10:49:48

Intel 300Wi-Fi芯片

2024-01-24 09:24:19

自動駕駛算法
點贊
收藏

51CTO技術棧公眾號

99精品女人在线观看免费视频| 日韩偷拍自拍| 欧美日本一区二区高清播放视频| 日韩欧美一级精品久久| 欧美在线一区视频| 爱久久·www| 国产91精品久久久久久久网曝门 | 日韩欧美国产午夜精品| 国产免费成人在线| 亚洲黄色小说在线观看| 97在线观看免费高| 福利片在线一区二区| 一本大道久久a久久精品综合| 亚洲精品成人三区| 特级丰满少妇一级aaaa爱毛片| 久久精品人人做人人爽电影蜜月| 久久国产精彩视频| 精品久久久久久中文字幕人妻最新| 久久伊人国产| 日韩欧美国产激情| 中文字幕精品在线播放 | 日韩成人小视频| 香蕉视频999| 亚洲精品永久免费视频| 亚洲欧美视频在线观看视频| 欧美在线视频二区| 午夜精品一二三区| 狠狠久久亚洲欧美| 国产精品xxx视频| 日本熟女一区二区| 午夜精品电影| 精品国偷自产在线视频| 极品蜜桃臀肥臀-x88av| 亚洲深夜福利在线观看| 精品久久国产老人久久综合| 一区二区三区欧美精品| 992tv国产精品成人影院| 欧美日韩国产在线看| 人人妻人人澡人人爽欧美一区| av中文天堂在线| 久久午夜色播影院免费高清| 国内视频一区| 丰满肉嫩西川结衣av| 国内一区二区在线| 91精品免费视频| 6—12呦国产精品| 琪琪一区二区三区| 国产精品成人一区| 青青草视频在线观看免费| 欧美专区18| 欧洲一区二区视频| 无码人妻熟妇av又粗又大| 亚洲综合另类| 日本国产欧美一区二区三区| 800av免费在线观看| 一区二区三区四区五区在线| 91精品国产网站| 日产电影一区二区三区| 亚洲国内欧美| 性欧美暴力猛交69hd| 国产无码精品视频| 亚洲毛片播放| 欧美亚洲国产另类| 国产精品欧美综合| 精品无码三级在线观看视频| 亚洲a中文字幕| 国产福利免费视频| 9色porny自拍视频一区二区| 久久久成人的性感天堂| 91免费人成网站在线观看18| 亚洲精品毛片一区二区三区| 免费黄网站欧美| 国产日韩欧美视频在线| 国产乱淫av片免费| 大胆亚洲人体视频| 欧美日韩电影一区二区| 成人午夜电影在线观看| 国产精品欧美久久久久一区二区| 自拍偷拍一区二区三区| caopeng在线| 亚洲综合偷拍欧美一区色| 日本人妻伦在线中文字幕| 91美女精品| 91久久精品一区二区三| 成年人三级黄色片| 亚洲国产欧美国产第一区| 亚洲高清av在线| 丝袜美腿中文字幕| 99久久九九| 久久久人成影片一区二区三区观看| 天天综合网入口| 美美哒免费高清在线观看视频一区二区 | 日韩一区二区电影在线观看| 成人影院在线观看| 欧美日韩国产黄| 久久综合伊人77777麻豆最新章节| www一区二区三区| 日韩成人网免费视频| 99久久精品久久亚洲精品| 亚洲视频免费| 国产精品久久久久久久9999| 亚洲成人黄色片| 久久精品夜色噜噜亚洲a∨| 黄黄视频在线观看| 日日av拍夜夜添久久免费| 欧美一区二区三区精品| 最近中文字幕在线mv视频在线| 五月久久久综合一区二区小说| 国内精品久久久久久影视8| 一级黄色大毛片| 91亚洲精品乱码久久久久久蜜桃| 免费看啪啪网站| 亚洲精品**中文毛片| 日韩一级片在线观看| 国产美女永久免费无遮挡| 亚洲视频狠狠| 亚洲free嫩bbb| 91亚洲欧美| 欧美性videos高清精品| 97精品人人妻人人| 99久久婷婷| 国产成人精品在线视频| 黄色aaa大片| 日韩一区在线看| 熟女少妇精品一区二区| 欧美交a欧美精品喷水| 久精品免费视频| 亚洲一级视频在线观看| 国产日韩欧美亚洲| 国产精品50p| 丁香5月婷婷久久| 久久在精品线影院精品国产| 亚洲在线精品视频| 国产午夜一区二区三区| 成人一级片网站| 欧美国产不卡| 午夜精品在线视频| 日本精品一区二区在线观看| 一区二区三区四区亚洲| 99热一区二区| 全球成人免费直播| 国产成人自拍视频在线观看| 香蕉久久一区二区三区| 香港成人在线视频| 永久免费未满蜜桃| 韩国精品一区二区三区| 91九色视频在线观看| caopo在线| 日韩天堂在线观看| 免费在线看黄网址| 国产91对白在线观看九色| 加勒比海盗1在线观看免费国语版| 成人豆花视频| 蜜臀久久99精品久久久无需会员 | 欧美日韩精品在线观看视频| 国产自产v一区二区三区c| 在线观看免费91| 国产精一区二区| 欧美成人自拍视频| 亚洲精品一区二区三区蜜桃| 亚洲一区二区三区中文字幕| 精人妻一区二区三区| 99国产精品久久久久久久| 精选一区二区三区四区五区| 欧美gay视频| 在线亚洲国产精品网| 国产精品久久免费| 亚洲国产综合在线| 免费观看av网站| 青青草成人在线观看| 国产91av视频在线观看| 欧美1区2区3| 国内外成人免费激情在线视频| 手机看片国产1024| 在线精品视频免费播放| 精品女人久久久| 国产成人欧美日韩在线电影| 18禁免费无码无遮挡不卡网站| 欧美色女视频| 91精品网站| 户外露出一区二区三区| 欧美成人合集magnet| 天天干天天插天天操| 欧美最猛黑人xxxxx猛交| 国产免费无码一区二区视频| 91尤物视频在线观看| 免费涩涩18网站入口| 欧美一区二区三区另类| 久久资源av| 国产精品国产三级在线观看| 欧美亚洲免费电影| 久久综合之合合综合久久| 亚洲丁香婷深爱综合| 中文字幕 视频一区| 一区二区三区四区精品在线视频 | 91亚洲免费视频| 好吊视频一区二区三区四区| 日韩女优中文字幕| 一区二区三区四区精品视频| 国产精品白丝jk喷水视频一区 | 成人在线电影在线观看视频| 2014亚洲精品| 日韩精选视频| 久久久影视精品| 日本美女高清在线观看免费| 日韩二区三区在线| 国产片高清在线观看| 色综合久久综合网欧美综合网| 三级黄色片在线观看| 91在线观看视频| 无码人妻少妇色欲av一区二区| 视频一区二区中文字幕| 亚洲精品无码国产| 91蜜臀精品国产自偷在线| 久久亚洲高清| 中文字幕一区日韩精品| 国产精品手机播放| 性孕妇free特大另类| 欧美风情在线观看| 黄网址在线观看| 中文字幕日韩在线播放| 同心难改在线观看| 亚洲第一网站免费视频| 99视频免费看| 欧美日韩视频第一区| 黄色片中文字幕| 午夜精品一区二区三区三上悠亚| 2018天天弄| 国产精品不卡一区二区三区| 国产肥白大熟妇bbbb视频| 99久久精品久久久久久清纯| 国产高潮失禁喷水爽到抽搐| 精品一区二区在线视频| www.com黄色片| 秋霞成人午夜伦在线观看| 狠狠爱免费视频| 久久xxxx精品视频| 亚洲午夜精品久久久久久人妖| 国产精品va| 水蜜桃在线免费观看| 91精品一区二区三区综合| 亚洲精蜜桃久在线| 日韩欧美视频| 四虎永久国产精品| 不卡在线一区二区| 亚洲激情一区二区三区| 四季av一区二区三区免费观看| 午夜欧美性电影| 成人嫩草影院| 亚洲第一在线综合在线| 日韩在线第七页| 亚洲精品高清国产一线久久| 日韩av有码| 99re99热| 今天的高清视频免费播放成人| 99热久久这里只有精品| 亚洲经典三级| 欧美日韩亚洲一| 欧美亚洲一级| 一级在线免费视频| 另类小说综合欧美亚洲| 久久久久久久久久久久久久久国产| 激情亚洲综合在线| 国产老头和老头xxxx×| av激情综合网| 在线观看福利片| 国产日韩欧美电影| 久久久久久久久久97| 樱花草国产18久久久久| 国产精品视频久久久久久久| 色偷偷一区二区三区| 中文字幕无线码一区| 制服丝袜成人动漫| 深爱五月激情五月| 亚洲香蕉成视频在线观看| 日本在线观看网站| 色综合天天狠天天透天天伊人| √8天堂资源地址中文在线| 欧美做受高潮电影o| 国产成人亚洲一区二区三区| 91精品婷婷国产综合久久蝌蚪| 日韩影视高清在线观看| 午夜精品福利一区二区| 91精品秘密在线观看| 国产69精品久久久久999小说| 久久一区中文字幕| 深爱五月综合网| 2023国产精品视频| 美女视频久久久| 欧美日在线观看| 国产麻豆91视频| 亚洲美女福利视频网站| 主播国产精品| 日韩免费在线视频| 日韩精品成人在线观看| 欧美精品中文字幕一区二区| 91精品蜜臀一区二区三区在线| 熟女少妇在线视频播放| 精品一区二区国语对白| 大地资源二中文在线影视观看| 国产精品私人影院| 国产无遮挡免费视频| 欧美日本韩国一区二区三区视频| 午夜激情在线视频| 久久国产精品免费视频| 女生影院久久| 国产精品久久久一区二区三区| 不卡一区2区| 日韩av在线第一页| 国产麻豆精品在线观看| 在线观看国产精品一区| 亚洲mv在线观看| 国产视频一区二区三| 国产一区二区三区免费视频| av手机在线观看| 91在线观看免费高清| 欧美色图一区| 大陆极品少妇内射aaaaa| 国产成人在线视频免费播放| 东京热无码av男人的天堂| 五月天一区二区三区| 国产a级免费视频| 色偷偷亚洲男人天堂| 不卡福利视频| 国产一区二区三区av在线| 欧美精品一级| 福利视频999| 中文字幕av一区 二区| 中文字幕一区二区人妻视频| 亚洲国产精品成人精品 | 欧洲成人免费aa| 岛国成人av| 国产一级不卡视频| 国产一区二区三区免费在线观看| 波多野结衣一二三四区| 色婷婷综合中文久久一本| 人妻无码中文字幕| 欧美激情乱人伦| 一区二区亚洲视频| 国产资源第一页| 国产精品资源网| 老湿机69福利| 在线播放中文一区| 黄色动漫在线| 亚洲一区亚洲二区亚洲三区| 久久久精品久久久久久96| 亚洲欧美手机在线| 综合久久久久久| 国产伦精品一区二区三区四区 | 韩国精品主播一区二区在线观看 | 成人在线观看一区二区| 亚洲综合视频网| 日本高清视频免费观看| 久久久爽爽爽美女图片| 美女视频亚洲色图| 精品久久久久久久久久中文字幕| av中文字幕亚洲| 在线免费黄色av| 亚洲人成在线观看网站高清| 老司机2019福利精品视频导航| 久久久com| 久久一区欧美| 亚洲综合视频网站| 日韩欧美一区中文| 丁香花在线电影小说观看| 精品在线不卡| 日本va欧美va欧美va精品| 日本视频在线免费| 欧美一级免费大片| 99热99re6国产在线播放| 精品欧美日韩| 日韩电影免费一区| 伊人久久久久久久久久久久久久| 日韩一级大片在线观看| 欧美激情网站| 日韩欧美99| 国产高清亚洲一区| 国产精品xxxx喷水欧美| 亚洲小视频在线| 精品国产乱码一区二区三区| 免费拍拍拍网站| 欧美国产一区在线| 国产理论片在线观看| 国外成人在线直播| 成人毛片在线| 最新版天堂资源在线| 欧洲激情一区二区| 青春草免费在线视频| 欧美亚洲免费在线| 精品一区二区成人精品| 国产无人区码熟妇毛片多| 日韩中文理论片| 风间由美中文字幕在线看视频国产欧美 | 欧洲久久久久久| 国产麻豆精品在线观看| 国产婷婷色一区二区在线观看 | 区一区二区三区中文字幕| 国产一区二区三区在线看麻豆| 天天操天天干视频| 精品国偷自产在线视频|