精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大模型可解釋性你能理得清嗎?綜述已來,一文解你疑惑

人工智能
近期,中美多家研究機構聯合發布了大模型可解釋性技術的綜述,分別對傳統的 fine-tuning 模型和基于 prompting 的超大模型的可解釋性技術進行了全面的梳理,并探討了模型解釋的評估標準和未來的研究挑戰。

大規模語言模型在自然語言處理方面展現出令人驚訝的推理能力,但其內在機理尚不清晰。隨著大規模語言模型的廣泛應用,闡明模型的運行機制對應用安全性、性能局限性和可控的社會影響至關重要。

近期,中美多家研究機構(新澤西理工學院、約翰斯?霍普金斯大學、維克森林大學、佐治亞大學、上海交大、百度等)聯合發布了大模型可解釋性技術的綜述,分別對傳統的 fine-tuning 模型和基于 prompting 的超大模型的可解釋性技術進行了全面的梳理,并探討了模型解釋的評估標準和未來的研究挑戰。

  • 論文鏈接:https://arxiv.org/abs/2309.01029
  • Github 鏈接:https://github.com/hy-zhao23/Explainability-for-Large-Language-Models

解釋大模型的難點在什么地方?

為何解釋大模型有點難?大語言模型在自然語言處理任務上的驚艷表現引起了社會廣泛的關注。與此同時,如何解釋大模型在跨任務中令人驚艷的表現是學術界面臨的迫切挑戰之一。不同于傳統的機器學習或者深度學習模型,超大的模型架構和海量的學習資料使得大模型具備了強大的推理泛化能力。大語言模型 (LLMs) 提供可解釋性的幾個主要難點包括:

  • 模型復雜性高。區別于 LLM 時代之前的深度學習模型或者傳統的統計機器學習模型,LLMs 模型規模巨大,包含數十億個參數,其內部表示和推理過程非常復雜,很難針對其具體的輸出給出解釋。
  • 數據依賴性強。LLMs 在訓練過程中依賴大規模文本語料,這些訓練數據中的偏見、錯誤等都可能影響模型,但很難完整判斷訓練數據的質量對模型的影響。
  • 黑箱性質。我們通常把 LLMs 看做黑箱模型,即使是對于開源的模型來說,比如 Llama-2。我們很難顯式地判斷它的內部推理鏈和決策過程,只能根據輸入輸出進行分析,這給可解釋性帶來困難。
  • 輸出不確定性。LLMs 的輸出常常存在不確定性,對同一輸入可能產生不同輸出,這也增加了可解釋性的難度。
  • 評估指標不足。目前對話系統的自動評估指標還不足以完整反映模型的可解釋性,需要更多考慮人類理解的評估指標。

大模型的訓練范式

為了更好的歸納總結大模型的可解釋性,我們將 BERT 及以上級別的大模型的訓練范式分為兩種:1)傳統 fine-tuning 范式;2)基于 prompting 的范式。

1.傳統 fine-tuning 范式

對于傳統 fine-tuning 范式,首先在一個較大的未標記的文本庫上預訓練一個基礎語言模型,再通過來自特定領域的標記數據集進行 fine-tuning。常見的此類模型有 BERT, RoBERTa, ELECTRA, DeBERTa 等。

2.基于 prompting 的范式

基于 prompting 的范式通過使用 prompts 實現 zero-shot 或者 few-shot learning。與傳統 fine-tuning 范式相同,需要預訓練基礎模型。但是,基于 prompting 范式的微調通常由 instruction tuning 和 reinforcement learning from human feedback (RLHF) 實現。常見的此類模型包括 GPT-3.5, GPT 4, Claude, LLaMA-2-Chat, Alpaca, Vicuna 等。其訓練流程如下圖:

基于傳統 fine-tuning 范式的模型解釋

基于傳統 fine-tuning 范式的模型解釋包括對單個預測的解釋(局部解釋)和對模型結構級別組分如神經元,網絡層等的解釋(全局解釋)。

1.局部解釋

局部解釋對單個樣本預測進行解釋。其解釋方法包括特征歸因(feature attribution)、基于注意力機制的解釋(attention-based)、基于樣本的解釋(example-based)、基于自然語言的解釋(natural language explanation)。

(1) 特征歸因旨在衡量每個輸入特征(例如單詞、短語、文本范圍)與模型預測的相關性。特征歸因方法可以分類為:

  • 基于擾動的解釋,通過修改其中特定的輸入特征觀察對輸出結果的影響;
  • 基于梯度的解釋,將輸出對輸入的偏微分作為相應輸入的重要性指標;
  • 替代模型,使用簡單的人類可理解的模型去擬合復雜模型的單個輸出,從而獲取各輸入的重要性;
  • 基于分解的技術,旨在將特征相關性得分進行線性分解。

(2) 基于注意力的解釋:注意力通常被作為一種關注輸入中最相關部分的途徑,因此注意力可能學習到可以用于解釋預測的相關性信息。常見的注意力相關的解釋方法包括:

  • 注意力可視化技術,直觀地觀察注意力分數在不同尺度上的變化;
  • 基于函數的解釋,如輸出對注意力的偏微分。然而,學術界對于將注意力作為一個研究角度依然充滿爭議。

(3) 基于樣本的解釋從個例的角度對模型進行探測和解釋,主要分為:對抗樣本和反事實樣本。

  • 對抗樣本是針對模型對微小變動非常敏感的特性而生成的數據,自然語言處理中通常通過修改文本得到,人類難以區別的文本變換通常會導致模型產生不同的預測。
  • 反事實樣本則是通過將文本進行如否定的變形,通常也是對模型因果推斷能力的檢測。

(4) 自然語言解釋使用原始文本和人工標記的解釋進行模型訓練,使得模型可以生成自然語言解釋模型的決策過程。

2.全局解釋

全局解釋旨在從模型構成的層面包括如神經元,隱藏層和更大的組塊,為大模型的工作機制提供更高階的解釋。主要探究在不同網絡構成部分學習到的語義知識。

  • 基于探針的解釋 探針解釋技術主要基于分類器進行探測,通過在預訓練模型或者微調模型上訓練一個淺層分類器,然后在一個 holdout 數據集上進行評估,使得分類器能夠識別語言特征或推理能力。
  • 神經元激活 傳統神經元激活分析只考慮一部分重要的神經元,再學習神經元與語義特性之間的關系。近來,GPT-4 也被用于解釋神經元,不同于選取部分神經元進行解釋,GPT-4 可以用于解釋所有的神經元。
  • 基于概念的解釋 將輸入先映射到一組概念中,再通過測量概念對預測的重要性來對模型進行解釋。

基于 prompting 范式的模型解釋

基于 prompting 范式的模型解釋,需要對基礎模型和助手模型分別解釋以區別兩種模型的能力,并探究模型學習的路徑。其探究的問題主要包括:為模型提供解釋對 few-shot learning 的益處;理解 few-shot learning 和思維鏈能力的來源。

1.基礎模型解釋

  • 解釋對模型學習的好處 探究在 few-shot learning 的情況下解釋是否對模型學習有幫助。
  • 情境學習 探究情境學習在大模型中的作用機制,以及區分情境學習在大模型中和中等模型中的區別。
  • 思維鏈 prompting 探究思維鏈 prompting 提高模型的表現的原因。

2.助手模型解釋

  • Fine-tuning 的角色 助手模型通常先經過預訓練獲得通用語義知識,在通過監督學習和強化學習獲取領域內知識。而助手模型的知識主要來源于哪個階段依然有待研究。
  • 幻覺與不確定性 大模型預測的準確性和可信度依然是目前研究的重要課題。盡管大模型的推理能力強大,但其結果常常出現錯誤信息和幻覺。這種預測的不確定性為其廣泛應用帶來了巨大的挑戰。

模型解釋的評估

模型解釋的評估指標包含合理性 (plausibility),忠實度 (faithfulness),穩定性 (stability),魯棒性 (robustness) 等。論文主要講述了兩個被廣泛關注的圍度:1)對人類的合理性;2)對模型內在邏輯的忠實度。

對傳統 fine-tuning 模型解釋的評估主要集中在局部解釋上。合理性通常需要將模型解釋與人工標注的解釋按照設計的標準進行測量評估。而忠實性更注重量化指標的表現,由于不同的指標關注模型或數據的方面不同,對于忠實性的度量依然缺乏統一的標準。基于 prompting 模型解釋的評估則有待進一步的研究。

未來研究挑戰

1.缺乏有效的正確解釋

其挑戰來源于兩個方面:

  • 缺乏設計有效解釋的標準;
  • 有效解釋的缺乏導致對解釋的評估同樣缺乏支撐。

2.涌現現象的根源未知

對大模型涌現能力的探究可以分別從模型和數據的角度進行,從模型的角度,1)引起涌現現象的模型結構;2)具備跨語言任務超強表現的最小模型尺度和復雜度。從數據的角度,1)決定特定預測的數據子集;2)涌現能力與模型訓練和數據污染的關系;3)訓練數據的質量和數量對預訓練和微調各自的影響。

3.Fine-tuning 范式與 prompting 范式的區別

兩者在 in-distribution 和 out-of-distribution 的不同表現意味著不同的推理方式。1)在數據同分布(in-distribution)之下,其推理范式的不同之處;2)在數據不同分布的情況下,模型魯棒性的差異根源。

4.大模型的捷徑學習問題

兩種范式之下,模型的捷徑學習問題存在于不同的方面。盡管大模型由于數據來源豐富,捷徑學習的問題相對緩和。闡明捷徑學習形成的機理并提出解決辦法對模型的泛化依然重要。

5.注意力冗余

注意力模塊的冗余問題在兩種范式之中廣泛存在,對注意力冗余的研究可以為模型壓縮技術提供一種解決方式。

6.安全性和道德性

大模型的可解釋性對控制模型并限制模型的負面影響至關重要。如偏差、不公平、信息污染、社會操控等問題。建立可解釋的 AI 模型可以有效地避免上述問題,并形成符合道德規范的人工智能系統。

責任編輯:趙寧寧 來源: 機器之心
相關推薦

2019-08-29 18:07:51

機器學習人工智能

2024-05-28 08:00:00

人工智能機器學習

2023-03-07 16:48:54

算法可解釋性

2022-04-13 15:10:22

AI決策

2024-12-16 07:30:00

2021-01-08 10:47:07

機器學習模型算法

2019-03-28 09:26:26

數據科學模型機器學習

2018-04-02 10:28:10

iOSPWA蘋果

2025-01-13 08:13:18

2024-09-18 05:25:00

可解釋性人工智能AI

2023-06-25 13:28:21

2022-06-14 14:48:09

AI圖像GAN

2020-11-10 10:26:16

串口打印工具

2025-05-30 05:00:00

AI模型數據訓練

2022-09-29 10:26:59

iOSScaffoldflutter

2018-05-23 10:23:18

數據系統機器學習

2023-05-04 07:23:04

因果推斷貝葉斯因果網絡

2023-03-10 22:08:20

2025-02-28 06:35:47

2023-05-16 12:11:22

點贊
收藏

51CTO技術棧公眾號

天堂网2014av| 日韩精品久久久久久久酒店| 免费视频观看成人| 国产精品久久久久久久岛一牛影视| 91精品久久久久久久久青青| 青娱乐国产盛宴| 在线观看欧美理论a影院| 欧美亚洲动漫制服丝袜| 18视频在线观看娇喘| 人妻丰满熟妇av无码区hd| 视频一区二区不卡| 久久精品电影网| 亚洲色图14p| 在线欧美激情| 色综合天天综合给合国产| 在线视频福利一区| 四虎在线免费看| 日av在线不卡| 97精品久久久| 丰满的亚洲女人毛茸茸| 国产精品欧美大片| 正在播放一区二区| 黄色一级二级三级| 欧美日韩经典丝袜| 中文字幕一区二区三区在线播放 | 91在线小视频| 成人激情在线播放| 无码人妻丰满熟妇区bbbbxxxx| 亚洲综合五月| 中文字幕亚洲自拍| 成人无码www在线看免费| 超碰国产精品一区二页| 91精品福利视频| 青青青免费在线| 欧美14一18处毛片| 亚洲视频一区二区在线观看| 色视频一区二区三区| 色婷婷激情五月| 成人午夜大片免费观看| 91亚洲精华国产精华| 中文在线a天堂| 天堂久久久久va久久久久| 国产+成+人+亚洲欧洲| 久久久精品视频免费观看| 久久国产亚洲| 自拍偷拍亚洲区| 妖精视频在线观看免费| 国内精品久久久久久99蜜桃| 日韩精品视频在线观看网址| 亚洲精品激情视频| 粉嫩一区二区三区四区公司1| 日韩一区二区三区av| 日本中文字幕观看| 91九色成人| 3d成人h动漫网站入口| 日韩va在线观看| 四虎国产精品免费久久| 欧美精品99久久久**| 色天使在线观看| 国产精品高清一区二区 | 性猛交xxxx乱大交孕妇印度| 国产在线国偷精品免费看| 91精品中文在线| av网站免费大全| 粉嫩蜜臀av国产精品网站| 国产成人女人毛片视频在线| 日本黄色不卡视频| 91色porny| 日韩精品另类天天更新| 午夜小视频在线| 亚洲欧美另类图片小说| 狠狠噜天天噜日日噜| 多野结衣av一区| 日本久久一区二区三区| av在线网址导航| 欧美中文高清| 日韩精品极品毛片系列视频| xxxx日本免费| 亚洲成人最新网站| 欧美精品电影在线| 国产婷婷色一区二区在线观看| 日韩精品一二三区| 91免费在线视频网站| 亚洲精品国产手机| 久久久精品免费免费| 中文字幕欧美人与畜| 在线中文免费视频| 色婷婷综合激情| 黄色一级片免费播放| 国产一区调教| 最近2019年手机中文字幕| 麻豆疯狂做受xxxx高潮视频| 国产亚洲毛片在线| 成人激情av在线| 五月婷在线视频| 国产精品免费aⅴ片在线观看| 青青视频免费在线观看| 瑟瑟视频在线看| 色久优优欧美色久优优| www.国产福利| 色婷婷av一区二区三区丝袜美腿| 色先锋资源久久综合5566| 久久久久久天堂| 日本大胆欧美人术艺术动态| av资源站久久亚洲| 国产在线你懂得| 亚洲国产视频网站| 色天使在线观看| 日韩精品导航| 欧美精品在线免费观看| 波多野结衣网站| 成人午夜电影网站| 激情视频小说图片| 亚洲a∨精品一区二区三区导航| 欧美成人一区二区三区片免费| 精品无人区无码乱码毛片国产 | 99久久精品国产精品久久| 艳色歌舞团一区二区三区| 三级在线观看视频| 欧美成人伊人久久综合网| 激情高潮到大叫狂喷水| 麻豆9191精品国产| 国产精品区一区| 菠萝蜜视频国产在线播放| 欧美小视频在线观看| 性生交大片免费看l| 欧美独立站高清久久| 4438全国成人免费| 欧美少妇bbw| 一区二区视频在线看| 美女在线视频一区二区| 国产成人3p视频免费观看| 久久免费视频在线| 亚洲精品久久久久久无码色欲四季 | 欧美写真视频网站| 37p粉嫩大胆色噜噜噜| 亚洲成人在线| 国产高清自拍一区| 日本动漫理论片在线观看网站 | 亚洲精品中文在线| 爽爽爽在线观看| 国产国产精品| 成人激情视频网| 大地资源网3页在线观看| 欧美日韩精品是欧美日韩精品| a级在线免费观看| 久久黄色网页| 色噜噜狠狠一区二区三区| free欧美| 国产午夜精品视频| 性高潮视频在线观看| 国产欧美一区二区在线观看| 欧美国产日韩在线播放| 国产欧美日韩精品一区二区免费| 欧美中文字幕视频| 九色网友自拍视频手机在线| 91福利小视频| 一本在线免费视频| 国产美女主播视频一区| 国产精品国三级国产av| 成人香蕉社区| 青青久久av北条麻妃黑人| 精华区一区二区三区| 欧亚一区二区三区| 免费一级suv好看的国产网站| 精品制服美女久久| 成人午夜视频免费观看| 国产一区二区三区不卡av| 欧美最近摘花xxxx摘花| 国产精品ⅴa有声小说| 欧美日韩一区二区在线视频| 成人免费视频网站入口::| 懂色av中文字幕一区二区三区| 缅甸午夜性猛交xxxx| 久久不见久久见国语| 国产剧情日韩欧美| 欧美6一10sex性hd| 亚洲网站在线观看| 国产又粗又猛又黄又爽无遮挡| 亚洲国产精品二十页| 色网站在线视频| 亚洲人成免费| 亚洲人成77777| 一区二区日韩| 国产精品成人在线| 最新日本在线观看| 亚洲人av在线影院| a在线观看免费| 日韩欧美黄色动漫| www.色小姐com| 91丨九色porny丨蝌蚪| 久久婷婷综合色| 亚洲国内精品| 中文精品一区二区三区| 国产成人精品亚洲线观看| 国产精品露脸自拍| 成人免费高清观看| 亚洲最新视频在线| 欧美自拍第一页| 欧美亚洲一区三区| 国产精品a成v人在线播放| 国产精品视频九色porn| 制服丝袜第一页在线观看| 久久精品av麻豆的观看方式| 国产原创中文在线观看 | 日本一区二区乱| 日韩av手机在线看| a级大胆欧美人体大胆666| 国产一区二区三区在线| 女人18毛片水真多18精品| 欧美丝袜第三区| 天天操天天操天天操天天| 一区二区高清在线| 顶级黑人搡bbw搡bbbb搡| 久久亚洲二区三区| 毛茸茸free性熟hd| 国产精品99久久久久久久女警| 欧美日韩亚洲自拍| 亚洲欧美日韩专区| 免费一级特黄毛片| 欧美体内she精视频在线观看| 亚洲精蜜桃久在线| 国产精品片aa在线观看| 国产区一区二区| 4438全国亚洲精品观看视频| 成人免费黄色网| 精品久久在线| 国产精品国产三级国产专播精品人| 人在线成免费视频| 午夜精品在线观看| 草草影院在线| 欧美第一黄网免费网站| 麻豆网站在线| 久久九九热免费视频| 尤物视频在线免费观看| 在线看片第一页欧美| 国产小视频在线播放| 国产亚洲精品美女久久久| 日韩av视屏| 国产视频精品免费播放| 手机看片福利在线| 日韩大陆毛片av| 日韩永久免费视频| 亚洲激情电影中文字幕| 亚洲乱码精品久久久久.. | 国产精品video| 色豆豆成人网| 国产精品露脸自拍| 欧美日韩va| 91亚洲国产成人久久精品网站| 成人免费91| 成人av电影免费| 国产成人澳门| 你懂的视频在线一区二区| 美日韩中文字幕| 日韩精品一区二区三区色偷偷 | 伊人久久久久久久久久久久| 一道本成人在线| 中文亚洲av片在线观看| 欧美日韩久久不卡| 国产www免费观看| 亚洲第一免费播放区| 性插视频在线观看| 亚洲人成亚洲人成在线观看| 番号在线播放| 米奇精品一区二区三区在线观看| 日本高清在线观看| 91精品国产91久久久久久最新| 中文字幕在线官网| 国产美女精品视频免费观看| 国产69精品久久| 亚洲xxxx3d| 日韩在线黄色| 一区二区日本| 在线日韩中文| 日本免费观看网站| 国产精品综合网| 亚洲一区二区乱码| 国产精品三级av在线播放| 国产精品白嫩白嫩大学美女| 午夜欧美在线一二页| 欧美日韩 一区二区三区| 欧美一区在线视频| 青青草观看免费视频在线| 日韩在线视频观看正片免费网站| 性欧美1819sex性高清大胸| 4k岛国日韩精品**专区| 亚洲日日夜夜| 久久久久一区二区| 性xxxx欧美老肥妇牲乱| 久久久亚洲精品无码| 男男成人高潮片免费网站| 好吊操视频这里只有精品| 久久精品网站免费观看| 精品欧美一区二区久久久久| 色婷婷精品久久二区二区蜜臀av| 国产乱码精品一区二区三区精东| 亚洲第一在线视频| 国产在线观看免费麻豆| 欧美中文在线视频| 视频一区在线| 午夜欧美性电影| 99精品视频免费观看| 网站在线你懂的| 久久精品一区二区三区不卡| 青青操视频在线播放| 欧美性三三影院| 亚洲av片在线观看| 九九久久国产精品| 久久69成人| 欧美在线视频二区| 亚洲国产精品一区制服丝袜| 国产欧美激情视频| 久久久不卡网国产精品一区| 国产极品美女高潮无套嗷嗷叫酒店| 欧美色倩网站大全免费| 免费在线黄色网址| 97精品久久久| 9l亚洲国产成人精品一区二三| 一区一区视频| 日本va欧美va瓶| 久久久久久久久久久久| 天天色图综合网| 黄色av网址在线| 欧美日本中文字幕| 国产精品国产亚洲精品| 一区二区三区我不卡| 日韩高清在线电影| 中文幕无线码中文字蜜桃| 偷偷要91色婷婷| 黄色av网址在线| 午夜精品一区二区三区在线视| 亚洲国产中文在线二区三区免| 美国av在线播放| 激情五月婷婷综合| 四虎地址8848| 欧美精品精品一区| 欧美成人性生活视频| 国产日韩综合一区二区性色av| 国产精品视频一区二区三区四蜜臂| 久久久久久久中文| 91在线小视频| 成人av网站在线播放| 亚洲女人天堂av| 日韩成人亚洲| 午夜午夜精品一区二区三区文| 日韩成人一级片| 99自拍偷拍视频| 欧美精品丝袜久久久中文字幕| 四虎久久免费| 成人免费观看网址| 国产精品v日韩精品v欧美精品网站| 精产国品一区二区三区| 一二三四区精品视频| 风流老熟女一区二区三区| 欧美激情在线观看视频| 精品精品国产三级a∨在线| 国产97在线 | 亚洲| 久久久久久久综合色一本| 一级一级黄色片| www亚洲欧美| 91成人在线精品视频| 男人添女人下面高潮视频| 久久久一区二区| 在线免费看毛片| 久久6免费高清热精品| 国内自拍欧美| 99草草国产熟女视频在线| 亚洲国产成人午夜在线一区| 国产精品无码久久久久成人app| 欧美精品在线免费播放| 欧美中文一区| 国内外成人免费在线视频| 亚洲欧美日韩国产另类专区| 囯产精品一品二区三区| 68精品久久久久久欧美| 日本不卡免费一区| 亚洲成人福利视频| 色婷婷久久综合| 在线观看的网站你懂的| 免费成人看片网址| 狠狠色伊人亚洲综合成人| 国产精品二区一区二区aⅴ| 国产香蕉97碰碰久久人人| 99综合久久| 无码人妻精品一区二区三区在线 | 日本在线观看不卡| 国产精品一区三区| 四虎成人在线观看| zzijzzij亚洲日本成熟少妇| 精品少妇3p| 欧美成人福利在线观看| 午夜伦理一区二区| 麻豆传媒视频在线观看免费| 久久精品二区| 国产一区二区91| 国产一级精品毛片| 国模精品视频一区二区| 国产精品99在线观看| 人人妻人人澡人人爽人人精品|