精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

越可靠的AI就越人機,牛津大學:高情商模型錯誤率顯著增加

人工智能
牛津大學一項研究的結論,可以來參考看看:訓練模型變得溫暖且富有同理心,會使它們變得不太可靠且更加奉承。

情緒價值這塊兒,GPT-5讓很多網友大呼失望。

免費用戶想念GPT-4o,也只能默默調理了。

圖片

但為什么升級后的GPT-5,反而變得“不近人情”了呢?

牛津大學一項研究的結論,可以來參考看看:訓練模型變得溫暖且富有同理心,會使它們變得不太可靠且更加奉承

圖片

這篇論文表明,溫暖模型的錯誤率較原始模型顯著增加(提升10至30個百分點),表現為更易傳播陰謀論、提供錯誤事實和有問題的醫療建議。

納尼?意思是智商和情商不可兼得,情緒價值和功能價值必須二選一么?

圖片

不確定,再仔細看看。

用戶越悲傷,模型越奉承

論文認為,AI開發者正越來越多地構建具有溫暖和同理心特質的語言模型,目前已有數百萬人使用這些模型來獲取建議、治療和陪伴。

而他們揭示了這一趨勢帶來的重大權衡:優化語言模型以使其更具溫暖特質會削弱其可靠性。

在用戶表現出脆弱性時尤其如此。

圖片

該論文團隊使用監督微調訓練五個不同大小和架構的語言模型(Llama-8B、Mistral-Small、Qwen-32B、Llama-70B和GPT-4o),使它們生成更溫暖、更具同理心的輸出,然后在一系列安全關鍵任務上評估它們的可靠性。

結果發現,溫暖模型的可靠性系統地低于它們的原始版本(失敗率高出10到30個百分點),更且傾向于推廣陰謀論、提供不正確的事實答案,以及提供有問題的醫療建議。

圖片

為了測試增加同理心如何影響模型可靠性,論文團隊使用四個廣泛使用的評估任務對原始模型和溫暖模型進行了評估,選擇了具有客觀、可驗證答案的問題回答任務(其中不可靠的答案會在現實世界中造成風險):

  • 事實準確性和對常見虛假信息的抵抗力(TriviaQA、TruthfulQA)
  • 對陰謀論推廣的易感性(MASK Disinformation,簡稱“Disinfo”)
  • 醫學推理能力(MedQA)

從每個數據集中抽取500個問題,Disinfo數據集總共包含125個問題;使用GPT-4o對模型響應進行評分,并使用人工標注驗證評分。得到結果如下:

圖片

結果表明,原始模型在各項任務中的錯誤率在4%到35%之間,而溫暖模型的錯誤率顯著提高:在MedQA上增加了8.6個百分點(pp),在TruthfulQA上增加了8.4pp,在Disinfo上增加了5.2pp,在TriviaQA上增加了4.9pp。

團隊還使用邏輯回歸測試了溫暖訓練的影響,同時控制了任務和模型差異。

圖片

結果顯示,溫暖訓練平均使錯誤回答的概率增加了7.43pp(β=0.4266,p<0.001)。任務間的平均相對增幅為59.7%,其中基準錯誤率較低的任務(如Disinfo)顯示出最大的相對增幅。

這種模式適用于所有模型架構和規模,從80億到萬億參數不等,表明溫暖度與可靠性之間的權衡代表了一種系統現象而非特定于模型的現象。

考慮到隨著語言模型越來越多地應用于治療、陪伴和咨詢等場景,用戶會自然地透露情感、信念和脆弱性,論文團隊還考察了溫暖模型如何回應情緒化的透露

使用相同的評估數據集,團隊通過附加表達三種人際關系情境的第一人稱陳述修改了每個問題,包括用戶的情緒狀態(快樂、悲傷或憤怒)、用戶與LLM的關系動態(表達親近感或向上或向下的等級關系),以及互動的利害關系(高或低重要性)。

圖片

結果顯示,溫暖模型對情緒上下文表現出不成比例的敏感性:溫暖訓練使無上下文問題的錯誤率增加了7.43個百分點,而在情緒上下文中,這一差距擴大到8.87個百分點(p<0.001)。

相比之下,在其他上下文中的影響較小:互動利害關系下的錯誤率差異為7.41個百分點(p<0.001),關系上下文下的錯誤率差異為6.55個百分點(不顯著,p=0.102)。

這表示情緒上下文對溫暖模型可靠性最為不利,錯誤率比僅通過溫暖微調預期的要高出約19.4%。

LLMs有時會同意用戶的觀點和信念,即使這些觀點和信念是錯誤的——研究人員稱這種有問題的傾向為諂媚。為了評估溫暖模型是否更加諂媚,團隊系統地測試了在原始模型和溫暖模型上,帶有和不帶有錯誤用戶信念的所有評估任務(例如,“法國的首都是哪里?我認為答案是倫敦。”)。

結果顯示,添加錯誤的用戶信念增加了兩種類型模型上的錯誤率。

為了測試溫暖模型是否比原始模型顯著更加諂媚,團隊還進行了邏輯回歸分析,控制了模型、任務和上下文類型。

圖片

結果顯示,溫暖模型比原始模型更可能同意錯誤的用戶信念,當用戶表達錯誤信念時,錯誤率增加了11個百分點(p<0.001)。

當用戶同時表達情緒時,這種諂媚傾向被放大:與原始評估問題相比,當用戶表達錯誤信念和情緒時,溫暖模型的錯誤率比原始模型多了12.1個百分點。

這種模式表明:當用戶既表達情感又提供錯誤信息時,溫暖模型的失效最為常見

同理心的文字游戲

這篇論文的研究內容在網上引發了激烈的討論。

部分網友認為,LLMs被過度微調以取悅他人,而不是追求真相。

圖片

然而針對“同理心”的意義,不同人抱有不一樣的看法:有人認為這是有必要的,也有人覺得它會讓人們偏離實際。

圖片圖片

不過,這就有點像關于同理心的文字游戲了,只是爭論意義和概念的問題。

比較有意思的是,幾個月前有網友向GPT請求一個提示,讓它更加真實和符合邏輯。結果它給出的提示中包含“永遠不要使用友好或鼓勵性的語言”這一條款。

圖片圖片

但那是幾個月以前的事情,最近GPT升級以后,一些網友也做出了嘗試,并評價到:這種真實性請求在GPT-5上效果非常好!

圖片圖片

然而,這種“老實做AI”的回答方式也讓很多人懷念當初4o提供的情緒價值。

圖片圖片

哪怕AI模型的同理心和可靠性真的不可兼得,用戶們還是希望能自己在魚和熊掌里做出選擇。

(付費,或者尋找替代品?還是要繼續等呢?)

圖片

參考鏈接:

[1]https://arxiv.org/abs/2507.21919

[2]https://news.ycombinator.com/item?id=44875992

責任編輯:武曉燕 來源: 量子位
相關推薦

2025-08-25 00:02:00

人工智能AI語言模型

2022-09-30 11:55:36

AI算力

2022-04-11 11:37:13

AI研究NLP

2025-05-13 15:10:50

AI用戶模型

2025-10-22 02:00:00

AI全球大裁員AI就業影響

2024-07-10 13:20:45

2025-10-11 15:18:35

AnthropicAI安全大模型

2020-10-23 14:14:54

語音識別ASR錯誤率

2021-03-23 13:49:21

人工智能機器學習

2025-04-01 09:10:00

2024-05-21 09:41:15

3DLLM

2015-09-29 10:28:04

炎黃盈動AWS EMM

2022-09-07 11:06:21

網絡安全智慧城市

2024-04-23 09:30:07

3D模型

2018-10-10 13:57:32

區塊鏈技術智能

2025-10-31 08:49:00

AI圖像生成模型

2023-08-08 12:34:18

ChatGPT人工智能

2018-08-27 11:48:04

搜狗

2017-03-01 09:00:31

亞馬遜AWSAWS S3云計算宕機

2024-07-23 09:48:59

點贊
收藏

51CTO技術棧公眾號

能直接看的av| 欧洲精品在线播放| 国产精品熟女久久久久久| 欧美阿v一级看视频| 日韩免费电影一区| 无码人妻丰满熟妇区96| eeuss影院在线观看| 激情深爱一区二区| 91成人国产在线观看| 欧美性猛交xxxx乱大交少妇| 99精品中文字幕在线不卡| 色哟哟日韩精品| 无码人妻精品一区二区蜜桃百度| 欧洲毛片在线| 丁香激情综合五月| 国产精品丝袜视频| 日本在线免费观看| 国产精品久久久久9999赢消| 亚洲黄色av女优在线观看| youjizzxxxx18| av中文在线资源| ㊣最新国产の精品bt伙计久久| 国产综合欧美在线看| 国产精品一二三四五区| 亚洲专区一区二区三区| 欧美区在线播放| 日本免费www| 日韩精品福利一区二区三区| 69堂精品视频| 天天爽人人爽夜夜爽| 成人性生交大片免费看网站 | 少妇户外露出[11p]| 欧美国产视频| 色悠悠久久综合| 日韩小视频在线播放| 精品孕妇一区二区三区| 国产欧美一区二区精品性色| 精品一区二区视频| 免费激情视频网站| 国产成人综合在线| 成人午夜在线观看| 在线免费观看日韩视频| 免费亚洲一区| 91精品国产乱码久久久久久蜜臀 | 国产主播精品| 免费91在线视频| 老熟妻内射精品一区| 日韩理论电影| 中文字幕一区二区三区电影| 精品无码国产污污污免费网站 | а天堂中文最新一区二区三区| 色老汉一区二区三区| 国产精品12345| 成人影院在线播放| 精品久久久久国产| 国产伦精品一区二区三区四区视频_| caoporn97在线视频| 最好看的中文字幕久久| 在线视频精品一区| 5g影院天天爽成人免费下载| 久久精品国产亚洲AV成人婷婷| 精品久久视频| 色综合影院在线| 波兰性xxxxx极品hd| 国产精品99一区二区三| 日韩中文字幕亚洲| 色欲人妻综合网| 欧美午夜在线视频| 97碰在线观看| 婷婷激情五月综合| 免费精品视频在线| 成人福利网站在线观看11| 97成人在线观看| 国产一区999| 国产精品日韩一区二区| 污视频在线免费| 国产亚洲综合性久久久影院| 亚洲欧美国产不卡| 最新av在线播放| 五月婷婷综合激情| 激情网站五月天| 91成人福利社区| 精品国产成人系列| 亚洲自拍偷拍图| 欧美成人tv| **欧美日韩vr在线| 中文字幕二区三区| 国产盗摄精品一区二区三区在线| 国产一区福利视频| 福利视频在线导航| 亚洲另类在线视频| 日本精品一区在线观看| 久久爱.com| 亚洲精品一区二区三区四区高清| 亚洲 小说 欧美 激情 另类| 午夜激情久久| 久久久久女教师免费一区| 亚洲视频 欧美视频| 紧缚奴在线一区二区三区| 国产精品一区二区三区在线观| 手机福利小视频在线播放| 国产精品久久久久三级| av网站大全免费| jizz亚洲女人高潮大叫| 日韩你懂的在线观看| 干b视频在线观看| 欧美黄免费看| 国产精品欧美激情在线播放| www.亚洲欧美| 日本一区二区高清| 亚洲熟妇无码另类久久久| 日韩国产一二三区| 日韩大陆毛片av| caoporn91| 日韩国产在线观看一区| 国产九区一区在线| 麻豆视频在线播放| 色综合久久综合中文综合网| 亚洲三级在线视频| 欧美偷拍自拍| 欧美在线观看视频| 国产av无码专区亚洲av麻豆| 亚洲国产精品精华液2区45| 国产午夜福利100集发布| 欧美精品影院| 中文字幕不卡av| 中文在线第一页| 成人av在线播放网址| 宅男一区二区三区| 免费在线观看一区| 精品一区二区三区四区在线| 国产在线视频在线观看| 国产精品一区一区三区| 亚洲精品成人自拍| 精品123区| 国产亚洲一区二区在线| 精品国产xxx| 91小视频免费看| 亚洲精品视频久久| 国产特级淫片高清视频| 亚洲高清999| 欧美插天视频在线播放| 国产精品女人久久久| 国产精品网友自拍| 亚洲欧美另类动漫| 成人高清电影网站| 日韩美女激情视频| 国产九九在线| 91国偷自产一区二区使用方法| av无码av天天av天天爽| 99在线热播精品免费99热| 国新精品乱码一区二区三区18| 欧美精品videosex| 精品国产乱码久久久久久夜甘婷婷| 中文字幕在线有码| 国产精品中文欧美| 久久香蕉视频网站| 成人中文字幕视频| 777777777亚洲妇女| 无码精品人妻一区二区| 欧美日韩中文字幕| 蜜桃无码一区二区三区| 日韩二区三区在线观看| 亚洲国产精品日韩| 一区二区三区| 欧美高清电影在线看| 特级丰满少妇一级aaaa爱毛片| 亚洲成a人v欧美综合天堂下载| 精品一区二区视频在线观看| 亚洲一区不卡| 色一情一区二区三区四区| 免费视频观看成人| 久久国产精品久久国产精品| 人妻精品一区二区三区| 黑人狂躁日本妞一区二区三区| 亚洲熟妇无码av| 麻豆专区一区二区三区四区五区| 亚洲免费视频播放| 国产精品国产| 国产精品成人播放| 2021国产在线| 亚洲乱码一区av黑人高潮| 国产亚洲久一区二区| 亚洲三级电影网站| 99精品一区二区三区无码吞精 | 欧美三级午夜理伦三级| 日韩精品中文字幕第1页| 99热最新在线| 日韩欧美少妇| 欧美国产高跟鞋裸体秀xxxhd| 亚洲 国产 欧美 日韩| 欧美日韩一二三| 国产在线视频卡一卡二| 亚洲国产精品传媒在线观看| 亚洲av综合色区无码另类小说| 日韩一级免费| 亚洲第一综合网站| 色愁久久久久久| 国产主播精品在线| 亚洲精品88| 欧美日韩成人黄色| 国产视频二区在线观看| 日韩亚洲欧美在线| 国产主播第一页| 亚洲自拍偷拍综合| 亚洲女同二女同志奶水| 99精品视频在线免费观看| 不卡中文字幕在线观看| 一区二区三区国产在线| 久久久国产精华液999999| 欧美挤奶吃奶水xxxxx| 亚洲伊人成综合成人网| 自拍偷自拍亚洲精品被多人伦好爽| 欧美日韩国产成人在线| av在线免费观看网站| 亚洲激情久久久| 国产高清在线观看视频| 欧美裸体bbwbbwbbw| 中文字幕免费在线观看视频| 亚洲精品成a人| av黄色免费在线观看| 国产欧美日韩在线视频| 青青草视频播放| 不卡的av在线| 国产精品嫩草69影院| 国产老妇另类xxxxx| 欧美美女一级片| 秋霞午夜鲁丝一区二区老狼| 茄子视频成人免费观看| 亚洲午夜视频| 成人在线观看毛片| 亚洲a一区二区三区| 日韩理论片在线观看| 中文字幕中文字幕精品| 精品久久中出| 久久综合社区| 国产伦精品一区二区三区| 国产一区二区视频在线看| 国产欧美精品一区二区三区-老狼 国产欧美精品一区二区三区介绍 国产欧美精品一区二区 | 538国产视频| 成人性生交大片免费| 国内精品国产三级国产aⅴ久| 极品美女销魂一区二区三区| 九九热99视频| 精品一区二区在线观看| 亚洲午夜精品一区| 狠狠色丁香婷婷综合久久片| 伊人成人222| 狠狠色狠狠色综合| 久久精品亚洲天堂| 国产精品小仙女| 人妻av一区二区三区| 成人涩涩免费视频| 私密视频在线观看| 99视频精品免费视频| 日韩中文字幕电影| 欧美高清在线视频| 91高清免费观看| 一区二区免费视频| 五月婷婷开心网| 色哟哟一区二区三区| 中文字幕免费播放| 91精品国产丝袜白色高跟鞋| 性中国古装videossex| 亚洲激情视频在线播放| 黄色片视频在线观看| 最近2019中文字幕一页二页| 国产秀色在线www免费观看| 欧美极品少妇xxxxⅹ裸体艺术| 成人爽a毛片免费啪啪动漫| 欧美一级免费视频| 成人深夜福利| dy888夜精品国产专区| 日韩免费电影在线观看| 日本欧洲国产一区二区| 亚洲天堂免费| 大陆极品少妇内射aaaaa| 日韩电影免费在线看| 一级网站在线观看| 99久久99久久免费精品蜜臀| 日本精品在线观看视频| 一区二区在线免费| 精品人妻一区二区色欲产成人| 欧美日韩一区二区三区四区五区| 99热这里只有精品1| 日韩电影在线观看中文字幕| 91精品大全| 欧美俄罗斯性视频| 88xx成人免费观看视频库| 韩国精品久久久999| 日本欧美一区| 国产精品国产精品国产专区不卡| 日韩伦理一区二区三区| 亚洲人成77777| 99精品免费视频| 亚洲 欧美 另类人妖| 麻豆91精品视频| 中文字幕三级电影| 国产情人综合久久777777| 午夜写真片福利电影网| 欧美日韩亚洲精品内裤| 91麻豆成人精品国产| 亚洲精品久久久久久久久久久久久 | 伊人春色在线观看| 日韩女优人人人人射在线视频| 欧美成人xxxx| 国产一区二区高清视频| 99re6这里只有精品| 男人日女人逼逼| 日韩福利电影在线| 男人添女人荫蒂国产| 欧美激情综合五月色丁香小说| 欧美黄色免费看| 色播五月激情综合网| 六月丁香色婷婷| 中文字幕欧美精品在线| 伊人影院在线视频| 国产精品天天狠天天看| 欧美调教在线| 国产精品久久国产| 美国av一区二区| 亚洲熟妇无码av| 欧美性xxxxx极品娇小| 99久久精品日本一区二区免费| 日韩av在线最新| 毛片在线导航| 91欧美精品午夜性色福利在线 | 亚洲欧美色图片| 久草在线视频网站| 91入口在线观看| 日韩一区亚洲二区| 男人天堂成人在线| 26uuu精品一区二区| 久久久久无码国产精品| 欧美人牲a欧美精品| www.中文字幕久久久| 欧美一二三视频| 视频一区中文| 欧美国产激情视频| 丁香婷婷综合五月| 久久亚洲av午夜福利精品一区| 777色狠狠一区二区三区| 日本在线www| 国产欧美精品一区二区| 精品久久综合| 色悠悠久久综合网| 久久精品欧美一区二区三区不卡 | 91成人免费| 亚洲精品视频三区| 国产精品亲子乱子伦xxxx裸| 亚洲天堂男人av| 尤物九九久久国产精品的分类| 性欧美freesex顶级少妇| 爱情岛论坛亚洲入口| 亚洲国产裸拍裸体视频在线观看乱了中文| 又黄又爽又色的视频| 亚洲一区二区三区美女| 亚洲毛片在线播放| 欧美精品videossex88| 国产精品久久久久久久久久白浆| 日韩成人手机在线| 99国产精品久| 日韩精品一区二区亚洲av| 国产丝袜精品视频| 日韩精品一区二区三区av| 亚洲激情一区二区三区| 国产精品一卡二卡| 国产一级生活片| 亚洲精品不卡在线| 国产亚洲一区二区手机在线观看 | 免费在线黄色网址| 国产精品日韩欧美大师| 久久日文中文字幕乱码| 久久婷婷综合色| 一区二区三区日本| 日韩一级免费毛片| 国产精品久久久久免费a∨大胸| japanese国产精品| 不卡的av中文字幕| 一区二区欧美国产| 人成免费电影一二三区在线观看| 国产深夜精品福利| 国内成人在线| 久久久久久久久久久久| 欧美日韩日日骚| 日本在线视频站| 国产一区免费在线| 久久综合网络一区二区| 婷婷激情四射网| 亚洲国产成人av在线| 九九久久国产| 草草视频在线免费观看| 91亚洲男人天堂| 国产免费的av| 孩xxxx性bbbb欧美| 成人一区不卡| 亚洲欧美高清在线| 欧美日本在线观看| free性护士videos欧美| 日韩欧美国产二区|