精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

長鏈推理表象下,大模型精細表征張冠李戴的本質(zhì)

人工智能 新聞
我們構(gòu)建了等效交互理論體系,發(fā)表了幾十篇論文,在一定程度上證明并成功實現(xiàn)了對大部分神經(jīng)網(wǎng)絡的符號化解釋。

近些年,大模型的發(fā)展可謂是繁花似錦、烈火烹油。從 2018 年 OpenAI 公司提出了 GPT-1 開始,到 2022 年底的 GPT-3,再到現(xiàn)在國內(nèi)外大模型的「百模爭鋒」,DeepSeek 異軍突起,各類大模型應用層出不窮。

然而,無論在學術(shù)界還是在工業(yè)界,目前對大模型應用的評測都是單純在模型輸出層面判斷結(jié)果的準確性,而沒有從大模型內(nèi)在精細決策邏輯的角度來分析模型的可靠性。類比到人類社會,「實現(xiàn)內(nèi)在精細邏輯對齊」才是實現(xiàn)人與人互信的基礎(chǔ)。

圖片

  • 論文標題:Alignment Between the Decision-Making Logic of LLMs and Human Cognition: A Case Study on Legal LLMs
  • Arxiv 地址:https://arxiv.org/abs/2410.09083

無法在內(nèi)在邏輯上與人類認知溝通,也恰恰是黑盒智能模型無法取得信任的本質(zhì)——在可信問題上的「人」「機」有別,其主要問題并不在哲學、社會學方面,而是一個數(shù)學問題:能否嚴格地證明神經(jīng)網(wǎng)絡在單個樣本上輸出背后的千萬種不同變換,都可以在數(shù)值上嚴格表示為一個簡單的邏輯圖模型。

但是,因為神經(jīng)網(wǎng)絡的復雜結(jié)構(gòu)與所需要的清晰邏輯解釋是天然沖突的,所以「從數(shù)學上嚴格地解釋大模型內(nèi)在的精細決策邏輯」長期以來被認為是一個不可能完成的問題。好在沉舟側(cè)畔千帆過,柳暗花明又一村。我們構(gòu)建了等效交互理論體系,發(fā)表了幾十篇論文,在一定程度上證明并成功實現(xiàn)了對大部分神經(jīng)網(wǎng)絡的符號化解釋。

相關(guān)鏈接:

https://zhuanlan.zhihu.com/p/693747946

https://mp.weixin.qq.com/s/MEzYIk2Ztll6fr1gyZUQXg

大模型金玉其外,敗絮其中

一旦有了嚴謹?shù)慕忉屝岳碚摴ぞ撸斘覀兛梢郧逦亟鈽?gòu)出大模型的內(nèi)在決策邏輯時,我們驚訝地發(fā)現(xiàn),哪怕大模型在特定任務上展現(xiàn)出再高的準確率,其內(nèi)在的決策邏輯表征可謂是一塌糊涂,甚至一半以上都是混亂的、完全與正常推理邏輯不沾邊的。

很多應用需求是創(chuàng)造出來的。比如,在新的研究 [3] 中,我們以法律大模型為例,目前幾乎所有的法律大模型應用僅僅關(guān)注判案結(jié)果的正確性,而忽視了法律推理過程中可能潛在的不公平和倫理風險。

然而,當你第一次確切地解構(gòu)出一個法律大模型所使用的大量復雜、卻又一塌糊涂的決策邏輯時,當你在各種情景中驗證了這些錯誤邏輯的客觀存在及其數(shù)值嚴謹性時,很多認知就回不去了,就像見過元素周期表以后,五行煉丹也就回不去了。

我們發(fā)現(xiàn),法律大模型經(jīng)常錯誤地將與案件無關(guān)的時間、位置信息視為法律判決的理由,或者「張冠李戴」地將一個被告的行為引為其他被告的判案依據(jù)。

時代洪流滾滾向前,讓我們看看都發(fā)生了什么。

圖片

圖 1. 對 SaulLM-7B-Instruct 在案例 1 的解釋

讓我們考慮一個輸入案例圖片,它包含圖片個輸入變量(這里可以是案例中的各個短語),我們用集合圖片表示這些輸入變量的全集。由大模型生成的一個包含圖片個 tokens 的自然語言序列,圖片。這樣,大模型輸出結(jié)果的置信度得分圖片可以定義為:

圖片

其中,圖片表示在生成第圖片個 token 之前的前圖片個tokens 組成的序列。圖片表示給定輸入句子圖片和前圖片個tokens 的條件下生成第圖片個token的概率。

這樣,我們可以構(gòu)造出一個「與或交互邏輯模型」。

圖片

這個邏輯模型中包含「與交互」和「或交互」兩類操作。觸發(fā)函數(shù)圖片表示一個「與交互」,當且僅當集合圖片中全部輸入變量都被包含(沒有被遮擋)在樣本圖片時,函數(shù)圖片被激活,并返回 1;否則返回 0。

類似地,觸發(fā)函數(shù)圖片表示一個「或交互」,當集合圖片中任一輸入變量被包含(沒有被遮擋)在樣本圖片時,函數(shù)圖片被激活,并返回 1;否則返回 0。

無限擬合性:我們證明,無論我們?nèi)绾坞S機遮擋圖片個輸入單元,得到圖片個不同的遮擋輸入,構(gòu)造出的與或交互模型總可以精確近似出神經(jīng)網(wǎng)絡在這所有圖片個遮擋狀態(tài)下對生成目標的輸出置信度得分。

圖片

這里圖片表示遮擋輸入樣本圖片中屬于集合圖片中的輸入單元,僅保留屬于集合圖片中的輸入單元的遮擋樣本。

圖片

圖 2. 與或交互的無限擬合性

需要注意的是,與或交互解釋顯示,不同于驚艷的應用性能所展示的對大模型推理能力的想象,大模型的大部分決策邏輯并不是嚴密的、清晰的、層次化的邏輯鏈條,大部分交互概念僅僅表示詞匯之間的統(tǒng)計關(guān)聯(lián)性。類似于「詞袋」模型,當大模型基于輸入 prompt 生成下一個單詞或 token 時,其所依賴的交互效用大部分并沒有利用輸入上下文之間的邏輯關(guān)系,大部分決策依賴于詞匯間最淺表的統(tǒng)計關(guān)聯(lián)性來「盲猜」目標單詞。

比如,在上文案例中,大模型僅僅根據(jù)「chased」為生成的判決結(jié)果「Assault」給出了 0.3811 的置信度,而單獨一個「with an axe」短語也會為「Assault」判決增加 0.4632 的置信度。

固然這些單詞與判決結(jié)果有統(tǒng)計意義的強相關(guān)性,但是大模型的決策依據(jù)并沒有試圖建模這些單詞與犯罪嫌疑人之間的切實關(guān)系,并沒有理解哪些犯罪嫌疑人做了什么事兒,也就導致了大模型可能產(chǎn)生一些看似正確的結(jié)果,但是其推理過程中可能潛在巨大的倫理風險。

例如,在下面的案例中我們將展示大模型常常將不同犯罪嫌疑人的行為進行張冠李戴,使其他犯罪嫌疑人的行為影響到目標犯罪嫌疑人的判罰。

案例:張冠李戴,根據(jù)其他犯罪嫌疑人的行為做出判決

模型:BAI-Law-13B [1]

輸入:On the morning of December 22, 2013, the defendants Andy and Bob deceived Charlie and the three of them had an argument. Andy chased Charlie with an axe and bit Charlie, causing Charlie to be slightly injured. Bob hit Charlie with a shovel, injuring Charlie and shovel causing Charlie's death.

輸出:Intentional Injury,輸出置信度數(shù)值 2.3792

圖片

圖 3. 對 BAI-Law-13B 模型和 SaulLM-7B-Instruct 模型在案例 1 上的解釋

法律 LLM 很大一部分交互模式錯誤地使用了犯罪嫌疑人的行為來對另一個無關(guān)的犯罪嫌疑人做出判決,顯示出大模型存在的一種典型缺陷——張冠李戴。

大模型傾向于記憶敏感詞語(如武器)與輸出結(jié)果之間的相關(guān)性,而不是理解輸入 prompt 中真正的邏輯,例如識別誰做了哪些行為。

案例顯示,Andy 咬傷 Charlie,構(gòu)成傷害罪,隨后 Bob 用鐵鍬擊打 Charlie,導致 Charlie 死亡。案例經(jīng)由法律專家將與判決相關(guān)的實體行為標記為相關(guān)詞語,與判決不相關(guān)的詞語標記為不相關(guān)詞語,以及將不應影響判決的不正確的實體行為標記為禁止詞語。

在這起案件中,當法律大模型判決 Andy 行為的后果時,「hit」「with a shovel」「injuring」和「death」等描述 Bob 的行為和后果的詞語應被標記為禁止詞語,與Andy沒有直接關(guān)系。

在英文法律大模型 SaulLM-7B-Instruct 前 50 個最突出的 AND-OR 交互模式中,有 26 個 AND 交互模式和 24 個 OR 交互模式。如圖 1,可以看出 AND 交互模式圖片,AND 交互模式圖片,OR 交互模式 圖片分別對 Andy 的判決貢獻了顯著的可靠交互效應 = 0.47、= 0.33、= 0.09。然而,大模型也使用了描述 Bob 的行為和后果的禁止詞語得出對 Andy 的判決,例如,AND 交互模式圖片圖片圖片等對 Andy 的判決產(chǎn)生不可靠的交互效應 = -1.04、= 0.93、= 0.19。

在中文法律大模型 BAI-Law-13B 前 50 個最突出的 AND-OR 交互模式中,有 17 個 AND 交互模式和 33 個 OR 交互模式。如圖 3,可以看出 AND 交互模式  圖片,AND 交互模式圖片,OR 交互模式 圖片 分別對 Andy 的判決貢獻了顯著的可靠交互效應 = 0.33、= 0.17、= 0.06。然而,大模型也使用了描述 Bob 的行為和后果的禁止詞語得出對 Andy 的判決,例如,AND 交互模式 圖片,OR 交互模式圖片圖片 等對 Andy 的判決產(chǎn)生不可靠的交互效應 = -0.43、= -0.09、= -0.04。

這里大模型用的不可靠交互比例為 55.5%-58.5%。

圖片

圖 4.交互概念解釋率先揭示了大模型精細表征邏輯的隱患。大模型沒有建模長鏈推理」邏輯,而使用大量「張冠李戴」的局部信息來生成判決結(jié)果,引起了不容忽視的倫理問

圖 4 展示了 BAI-Law-13B 模型在中文案例上的解釋,判案所依據(jù)的大部分交互概念都是與目標犯罪嫌疑人無關(guān)的張冠李戴的交互概念。

責任編輯:張燕妮 來源: 機器之心
相關(guān)推薦

2025-07-04 08:42:00

2025-02-08 17:00:11

2025-07-08 03:11:00

2024-10-21 16:41:17

2025-08-01 14:32:35

AI模型訓練

2025-11-13 08:00:00

大推理模型AI人工智能

2023-06-05 10:01:18

模型測評

2024-12-12 17:30:00

模型測評AI

2025-04-30 16:48:07

2023-01-05 09:33:37

視覺模型訓練

2023-10-11 12:32:53

AI模型

2025-02-17 14:43:51

2024-04-15 12:50:00

大型語言模型ReFT

2023-05-05 13:29:04

模型推理

2024-07-08 12:18:13

2025-02-10 09:35:00

2025-08-11 08:00:00

2025-05-26 08:40:00

2025-09-23 09:06:00

AILLM系統(tǒng)

2023-09-01 15:37:56

點贊
收藏

51CTO技術(shù)棧公眾號

999久久久亚洲| 日韩天堂在线| 成人免费毛片app| 97免费视频在线| 中文字幕一区二区三区人妻电影| а√天堂中文资源在线bt| 久久亚洲精精品中文字幕早川悠里| 日韩av电影院| 丁香花五月激情| 亚洲自拍电影| 日韩女优视频免费观看| 各处沟厕大尺度偷拍女厕嘘嘘| 国产资源在线看| 国产麻豆视频一区二区| 欧美一级免费视频| 小泽玛利亚一区二区免费| 奇米影视777在线欧美电影观看| 在线精品视频一区二区| 欧美精品在欧美一区二区| 免费一级毛片在线观看| 国产精品一区二区久久精品爱涩| 日本sm极度另类视频| 久久爱一区二区| 神马日本精品| 精品国偷自产国产一区| 一本岛在线视频| 北岛玲heyzo一区二区| 亚洲免费在线视频| 亚洲春色在线视频| 日韩有码电影| 大陆成人av片| 亚洲字幕在线观看| 成人毛片一区二区三区| 99视频一区| 久久97久久97精品免视看 | 九九精品在线观看视频| 精品久久中文| 日韩精品一区二区视频| 四虎成人免费视频| 成人午夜888| 欧洲一区二区三区在线| 欧美v在线观看| 国产精品vvv| 亚洲一级电影视频| 午夜久久久久久久久久久| 成人福利在线| 国产欧美视频一区二区| 欧美激情www| 深夜福利视频在线观看| www.成人在线| 国产主播一区二区三区四区| 亚洲精品成av人片天堂无码 | 国产极品jizzhd欧美| 青草视频在线观看免费| 在线亚洲精品| 91精品国产91久久久久久最新 | 黄色国产在线观看| 精品国产导航| 日韩av一区二区在线| 99久久免费看精品国产一区| 国偷自产av一区二区三区| 精品少妇一区二区三区视频免付费 | 在线不卡欧美精品一区二区三区| 中文字幕国内自拍| 欧美综合社区国产| 91精品国产欧美一区二区| www.污污视频| 日韩三级精品| 亚洲аv电影天堂网| 亚洲天堂av网站| 欧美偷窥清纯综合图区| 亚洲欧美国产视频| 男人的天堂官网| 国产精品99一区二区三| 久久综合伊人77777尤物| 九九热只有精品| 亚洲激情社区| 国产z一区二区三区| 中日精品一色哟哟| 国产一区二区三区在线观看免费视频| 3d动漫啪啪精品一区二区免费| 国内精品久久久久久久久久久| 成人一道本在线| 蜜桃久久精品乱码一区二区| 成年人视频网站在线| 亚洲日本一区二区| 国产日本在线播放| 亚洲第一会所001| 欧美精品乱码久久久久久按摩| 波多野结衣中文字幕在线播放| av毛片精品| 国产一区二区三区在线看 | 亚洲国产日韩综合久久精品| 黄色www网站| 草民电影神马电影一区二区| 日韩小视频在线观看专区| 中文在线永久免费观看| 日韩电影二区| 97久久精品视频| 中文字幕在线播出| 成人av在线资源| 先锋影音亚洲资源| 97人人在线视频| 欧美日韩精品一区二区在线播放| 欧美69精品久久久久久不卡| 国产成人一区二区三区影院| 久久久国产精彩视频美女艺术照福利| 一区二区三区免费高清视频 | 亚洲二区视频在线| 精品久久久久久久无码 | 成人性生活视频| 在线播放中文字幕一区| 国产网站无遮挡| 一本一本久久a久久综合精品| 97超级碰碰碰久久久| 国产模特av私拍大尺度| 久久免费午夜影院| 成品人视频ww入口| 伊人久久大香线蕉综合影院首页| 日韩精品999| 麻豆国产尤物av尤物在线观看 | 久久久久久久久久久9不雅视频| …久久精品99久久香蕉国产| 99热这里只有精品3| 欧美国产97人人爽人人喊| 国产伦精品一区二区三区四区视频_| 日韩黄色三级| 在线成人激情视频| www亚洲视频| www.亚洲色图| 欧美日韩中文字幕在线播放| 欧美aaaaaaaa| 一区二区三区无码高清视频| 少妇太紧太爽又黄又硬又爽| 国产999精品久久| 91嫩草国产丨精品入口麻豆| 粉嫩av一区二区三区四区五区| 日韩麻豆第一页| 久久久久久久99| 成人视屏免费看| 免费观看亚洲视频| 欧洲一区在线| 久久夜精品va视频免费观看| 亚洲自拍第二页| 国产精品视频观看| 一区二区三区 欧美| 少妇精品久久久| 日韩av电影免费观看高清| 欧美黄色小说| 色综合咪咪久久| 欧美做受xxxxxⅹ性视频| 久久久久91| 欧美一区国产一区| 秋霞国产精品| 中文字幕综合一区| 国产尤物视频在线观看| 亚洲日本韩国一区| 色诱av手机版| 亚洲精品视频啊美女在线直播| 国产成人精品免费视频大全最热| 男插女视频久久久| 亚洲成成品网站| 97免费在线观看视频| 91日韩一区二区三区| 日韩a在线播放| 精品视频久久| 国产精品美女在线| 欧美成人hd| 欧美日韩二区三区| 印度午夜性春猛xxx交| 国产91精品精华液一区二区三区 | 能直接看的av| 国内外成人在线视频| 乱熟女高潮一区二区在线| 国产精品白丝一区二区三区| 欧美在线性爱视频| 在线观看av黄网站永久| 日韩视频一区二区三区| 日产精品久久久久| 中文字幕欧美激情一区| 男女视频在线观看网站| 亚洲激情不卡| 五月天丁香综合久久国产| 91麻豆精品| 午夜精品久久久久久久99黑人 | 自拍偷拍欧美激情| 午夜不卡久久精品无码免费| 午夜一区在线| 在线观看一区二区三区三州| 亚洲一区二区三区免费| 欧美中在线观看| 精品美女在线观看视频在线观看| 精品久久久久久无| 姑娘第5集在线观看免费好剧| 亚洲靠逼com| 少妇真人直播免费视频| 极品尤物av久久免费看| a√天堂在线观看| 999视频精品| 欧美二区在线看| 国产一区二区视频在线看| 97欧美精品一区二区三区| 69久久夜色| 亚洲韩国欧洲国产日产av| 国模私拍一区二区| 亚洲高清不卡在线观看| 四虎地址8848| 久久亚洲精华国产精华液| 极品人妻一区二区| 天堂成人国产精品一区| www.avtt| 国产精品久久观看| 欧美日韩在线精品| 成人爽a毛片免费啪啪红桃视频| 国产精品久久久久久av福利软件 | 成人欧美一区二区三区在线湿哒哒 | 日韩免费观看一区二区| 国产精品a级| 偷拍视频一区二区| 欧美成人午夜77777| 91精品视频免费看| 国产一区二区主播在线| 亚洲3p在线观看| sm国产在线调教视频| 国产亚洲精品久久久久久777| 国产 日韩 欧美 综合| 欧美另类videos死尸| 黄色一级视频免费看| 亚洲成a人v欧美综合天堂| 国产一二三四区| 国产精品第五页| 一级二级黄色片| 久久久99久久| 90岁老太婆乱淫| 91美女片黄在线观看91美女| 男人的天堂影院| 丁香激情综合五月| 精品久久久久久无码人妻| 韩日av一区二区| 中文字幕第17页| 久久精品国产99国产精品| www.99在线| 美女网站色91| 亚洲不卡视频在线| 蜜臀久久99精品久久久久久9 | 国产精品裸体一区二区三区| 国产乱码精品一区二区三区亚洲人| 国产精品爽爽ⅴa在线观看| 浪潮色综合久久天堂 | 国产精品一区无码| 狠狠躁夜夜躁人人躁婷婷91| 国产黄色片视频| 亚洲国产欧美在线人成| 久久精品这里有| 午夜精品一区二区三区免费视频| 国产亚洲精品久久久久久打不开| 一个色综合网站| 亚洲精品午夜久久久久久久| 亚洲午夜电影在线| 成人免费区一区二区三区| 欧美日韩激情美女| 91午夜精品亚洲一区二区三区| 一本一道久久a久久精品| 亚洲高清在线看| 欧美嫩在线观看| 精品国产av 无码一区二区三区 | 五月天六月丁香| 福利视频网站一区二区三区| 日本性生活一级片| 91在线小视频| 久久久久久国产免费a片| 国产精品伦理一区二区| 国产精品丝袜一区二区| 亚洲综合色婷婷| 午夜毛片在线观看| 在线看日本不卡| 国产成人精品毛片| 亚洲精品www久久久| 国产精品四虎| 欧美另类精品xxxx孕妇| 国产中文在线播放| 国产精品极品美女在线观看免费| 国产激情精品一区二区三区| 国产伦精品一区二区三区免 | 久久亚洲人体| www久久99| 精品久久久亚洲| 国产免费内射又粗又爽密桃视频| 夜夜夜久久久| 污网站在线免费| 91在线porny国产在线看| 貂蝉被到爽流白浆在线观看| 亚洲国产成人av好男人在线观看| www.色国产| 日韩一区二区三区视频| 日韩一区二区三区中文字幕| 操日韩av在线电影| 吉吉日韩欧美| 999视频在线观看| 国产一区二区三区网| av在线免费观看国产| 日韩中文字幕亚洲一区二区va在线 | 强开小嫩苞一区二区三区网站 | 精品久久久久久电影| 一二三区中文字幕| 精品一区电影国产| 18加网站在线| 国产免费一区二区三区香蕉精| 加勒比色综合久久久久久久久| 亚洲综合激情五月| 丝袜美腿亚洲综合| 理论片大全免费理伦片| 亚洲欧洲国产专区| 中文字幕在线日本| 亚洲精品动漫100p| 色女人在线视频| 国产日韩欧美中文| 精品freesex老太交| 成人午夜精品久久久久久久蜜臀| 国内精品视频一区二区三区八戒| 黄色国产在线观看| 亚洲国产成人av网| www男人的天堂| 久久久精品欧美| 久久精品黄色| 午夜精品一区二区在线观看的 | 国产无套粉嫩白浆在线2022年| 国产做受高潮69| 国产厕拍一区| 成人午夜免费在线视频| 国模大尺度一区二区三区| 日韩欧美视频免费观看| 欧美在线999| 春暖花开成人亚洲区| 日本人成精品视频在线| 特黄特色欧美大片| 成年人午夜免费视频| 成人一级黄色片| 五月天综合在线| 亚洲成人久久久| sm性调教片在线观看| 国产一区二区久久久| 亚洲国产一区二区三区a毛片| 成年人看片网站| 亚洲国产一区二区三区| 亚洲av无码一区二区三区性色 | 美女100%一区| 欧美国产视频在线观看| 亚洲欧美大片| 西西444www无码大胆| 在线欧美小视频| 91青青在线视频| 成人激情电影一区二区| 91成人看片| 极品白嫩的小少妇| 午夜电影一区二区三区| 天堂v视频永久在线播放| 日本精品久久中文字幕佐佐木| 国产精品一区二区99| 日本激情视频在线| 中文字幕日韩一区二区| av免费观看在线| 97在线视频精品| 国产日产精品一区二区三区四区的观看方式 | 国产欧美久久久久久久久| 亚洲最大av网| a91a精品视频在线观看| a天堂中文字幕| 欧美另类videos死尸| 日本高清在线观看视频| 精品视频导航| 蜜桃视频一区二区三区| 校园春色 亚洲| 日韩麻豆第一页| 一区在线不卡| 少妇人妻无码专区视频| 久久精品水蜜桃av综合天堂| 6—12呦国产精品| 欧美精品激情在线| 国内精品久久久久久99蜜桃| 九一精品久久久| 天天色天天操综合| 99青草视频在线播放视| 97人人干人人| 丝袜美腿亚洲一区| 91成人福利视频| 亚洲女人天堂av| 二区三区精品| 四虎永久在线精品无码视频| 亚洲色图欧美偷拍| 天天在线女人的天堂视频| 成人国产在线激情| 亚洲在线电影| 青草草在线视频| 亚洲一区二区黄| 国产在线播放精品| 91小视频在线播放| 日本久久精品电影| 高清电影在线免费观看| 色婷婷精品国产一区二区三区|