精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

ACL 2024 Oral | 大模型也會被忽悠?揭秘AI的信念之旅

人工智能 新聞
隨著模型的智能化,大模型逐漸展現(xiàn)出了一些人類的特性,但它們的本質(zhì)仍然是概率模型。這些模式很有可能仍然是從訓練語料中的人類行為學習而來,即是一種 “模仿游戲”。

本篇論文的第一作者是清華大學交叉信息院的二年級碩士生許融武。主要指導老師為美國東北大學 Weiyan Shi 助理教授、清華大學邱寒助理教授和徐葳教授。

地球是平的嗎?

當然不是。自古希臘數(shù)學家畢達哥拉斯首次提出地圓說以來,現(xiàn)代科學技術(shù)已經(jīng)證明了地球是圓形這一事實。

但是,你有沒有想過,如果 AI 被誤導性信息 “忽悠” 了,會發(fā)生什么?

來自清華、上海交大、斯坦福和南洋理工的研究人員在最新的論文中深入探索 LLMs 在虛假信息干擾情況下的表現(xiàn),他們發(fā)現(xiàn)大語言模型在誤導信息反復勸說下,非常自信地做出「地球是平的」這一判斷。

圖片


  • 論文鏈接:https://arxiv.org/pdf/2312.09085
  • 項目主頁:https://llms-believe-the-earth-is-flat.github.io/
  • GitHub 源代碼:https://github.com/LLMs-believe-the-earth-is-flat/llms-believe-the-earth-is-flat

生成式人工智能技術(shù)的快速發(fā)展,為生成虛假信息提供了便利。這些技術(shù)不僅能夠創(chuàng)建逼真的文本、圖像、音頻和視頻內(nèi)容,還能夠在社交網(wǎng)絡上自動發(fā)布和傳播這些內(nèi)容。虛假信息的泛濫給社會帶來了諸多挑戰(zhàn),但目前對這類信息的確切影響仍不十分清楚。然而,可以預見的是,隨著技術(shù)的發(fā)展,虛假信息的生成和傳播將會變得更加容易和普遍。

另一方面,大語言模型的上下文學習能力使其受到誤導性信息的影響。這種誤導性信息可能會在模型的部署過程中在上下文中被接受,并在模型生成的輸出中反映出來,導致其產(chǎn)生不準確或具有偏見的內(nèi)容。因此,研究者們正在努力探索如何提高大模型對虛假信息的識別能力和抵抗能力,這是提升大模型安全和魯棒性的重要內(nèi)容之一。

本篇研究就探索了這種有誤信息對于大語言模型知識信念的影響,研究論文已經(jīng)被 ACL 2024 接收,并選做大會報告(Oral)。

實驗:大模型的 “信念” 測試

研究者們首先構(gòu)建了一個名為 Farm(Fact to Misinform Dataset)的數(shù)據(jù)集,包含 1500 個事實性問題及其相關(guān)的誤導性信息。他們在大語言模型的幫助下系統(tǒng)性地構(gòu)造了更具有說服力的有誤信息:首先,他們對原始正確的事實性 QA 進行語義取反或者構(gòu)造錯誤答案,隨后利用 “越獄” 后的大模型協(xié)助生成更具有說服力的長文本有誤信息。

利用這些數(shù)據(jù),便可以測試大語言模型在多輪對話中面對虛假信息時的反應。測試過程分為三個階段:初始信念檢驗、多輪對話中勸說誤導、結(jié)果信念檢驗。模型的信念檢驗通過模型在閉卷 QA 中答案的信心分數(shù)反應。通過這種方式,研究者們能夠觀察到 LLMs 在多輪對話中信念的變化。

圖片

多輪測試框架

主要結(jié)果

在勸說性交流階段,研究者們使用了多種策略來誤導 LLMs 改變其信念。這些策略包括曉之以理的勸說(LO)、樹立權(quán)威的勸說(CR)和動之以情的勸說(EM)。結(jié)果顯示,即使是最先進的模型,如 GPT-4,也有高達 20.7% 的可能性被虛假信息所影響?;趯?ChatGPT、GPT-4、Llama-2-7B-chat、Vicuna-v1.5-7B、Vicuna-v1.5-13B 五種大模型平均準確度(Average Accuracy Rate, ACC)和被誤導率(Misinformed Rate, MR)的實驗,研究者們有五點發(fā)現(xiàn):

  • 絕大多數(shù)大模型都易被虛假信息欺騙:從最先進的 GPT-4 (注:本研究的完成時間是 2023 年 9 月,當時最先進的模型是 GPT-4)到最差的模型,所有模型在經(jīng)過多輪測試之后,誤導率從 20%-80% 不等。
  • 越先進的大模型抵抗虛假信息能力越強:實驗表明,抵抗能力最強的是 GPT-4 模型,其能以 80% 堅持自己的事實信念。這給了我們一些寬慰:上下文理解能力越強的模型,并非更容易受到有誤信息的干擾!
  • 多次重復虛假信息比單次輸出虛假信息更能騙倒大模型:通過多輪引入的虛假信息,其作用要勝過單此的引入,這很符合我們對安全性對齊的常識 —— 有害內(nèi)容越多,模型越容易被其影響。
  • 運用修辭的勸說性虛假信息更容易騙倒大模型:使用更復雜,更具有說服力的修辭可以增加模型改變看法的概率。這點就和人一樣,越 “真實” 的假信息,你越容易相信
  • 邏輯性說服比其它說服方式更有效:模型對邏輯性強的信息特別敏感,無論是真實信息還是虛假信息,只要邏輯連貫一致,就更容易影響模型的判斷。這表明,模型在處理信息時,可能過分依賴于表面的邏輯結(jié)構(gòu),而忽略了對信息來源和內(nèi)容真實性的深入驗證。

圖片

ChatGPT 和 GPT4 在不同勸說策略下的正確率(虛線)和誤導成功率(實線)

大模型面對虛假信息的五種反應

在面對虛假信息時,AI 表現(xiàn)出了五種不同的行為:拒絕(Rejection)、奉承(sycophancy)、不確定(Uncertainty)、接受(Acceptance)和自我不一致(Self-Inconsisitancy)。這些行為揭示了 AI 在處理錯誤信息時的復雜性。例如,拒絕行為表明 AI 堅持正確的答案,不受錯誤信息影響;而奉承行為則表明 AI 在對話中表面上接受錯誤信息,但內(nèi)心仍堅持正確答案。

圖片

模型的信念和對應面對誤信息的行為:拒絕,奉承和接納

研究還發(fā)現(xiàn),在經(jīng)過一輪虛假信息交互后,大語言模型的信心程度往往會降低。然而,對于一些問題,重復虛假信息卻讓大模型更加確信自己的答案,這種現(xiàn)象被稱為 “逆火效應(Backfire Effect)”。

如何提升抗虛假信息干擾能力?

研究組發(fā)現(xiàn),由于 RLHF(Reinforcement Learning with Human Feedback)算法,大模型在訓練中會傾向于接受用戶的輸入,即認為外界的 context 總是友善且正確的。而且當大語言模型有足夠信息支撐觀點時,會對正確的回答更有信心。

為了幫助大模型提升抗虛假信息干擾能力,研究者們提出了一種輕量級解決方案:在檢測到虛假信息后,使用 safety system prompt 對大模型進行提醒,并在回答之前從自己的參數(shù)化知識中檢索相關(guān)信息。這種方法在一定程度上減少了虛假信息對大模型的影響。

加入 safety system prompt 后,模型抗干擾能力顯著提升

OpenAI 的看法

有趣的是,OpenAI 在 2024 年 5 月發(fā)布了最新的 AI 模型行為準則,其中特別提到了 “認知沖突” 的處理。在此部分的示例中,他們使用了 “地球是平的” 這一例子來說明模型在面對與已知事實相沖突的信息時應如何反應,與本次研究團隊的標題不謀而合,也更加突顯了大語言模型在處理認知沖突時的行為表現(xiàn)的重要性。

https://cdn.openai.com/spec/model-spec-2024-05-08.html

研究啟發(fā)

隨著模型的智能化,大模型逐漸展現(xiàn)出了一些人類的特性,但它們的本質(zhì)仍然是概率模型。這些模式很有可能仍然是從訓練語料中的人類行為學習而來,即是一種 “模仿游戲”。

以上的研究探索了針對簡單事實問題,當 LLM 的內(nèi)部認知和外部信息沖突的時候,LLM 當作何選擇,是盲從還是堅持自己的意見?而人類在這種認知沖突的過程中所展現(xiàn)的 “理愈辯愈明”、“思想碰撞出火花” 等能力還是目前的 LLM 所不具備的。

未來的研究可以進一步從模型的內(nèi)在機理和訓練數(shù)據(jù)中對大模型的行為進行溯源式的分析,提高 AI 的可解釋性,并進一步提升跨學科研究,探索大模型的更多潛力。

責任編輯:張燕妮 來源: 機器之心
相關(guān)推薦

2021-04-01 22:30:19

人工智能機器人機器學習

2024-04-22 12:22:15

2019-04-05 10:10:22

AI機器學習安全

2025-04-17 09:00:00

2024-08-12 09:40:00

模型數(shù)據(jù)

2025-05-29 10:32:32

2012-07-06 10:15:55

大數(shù)據(jù)

2024-08-27 00:00:01

AI應用框架

2025-03-27 10:15:39

2024-07-02 13:30:50

2024-11-25 08:50:00

2025-04-25 00:20:00

大模型tokenizer

2024-06-19 16:11:22

2023-05-10 14:40:40

AI模型算力

2025-06-20 10:18:58

大模型

2019-09-10 13:48:12

NLP神經(jīng)網(wǎng)絡模型

2025-07-15 09:44:16

AI人工智能大模型

2023-07-19 19:01:11

2024-08-20 08:40:54

點贊
收藏

51CTO技術(shù)棧公眾號

日韩精品视频观看| 风流少妇一区二区| 在线精品国产欧美| 女王人厕视频2ⅴk| 免费观看欧美大片| 国产精品入口麻豆九色| 99国产超薄丝袜足j在线观看 | 韩国精品久久久999| av直播在线观看| 国产精品亚洲欧美日韩一区在线| 亚洲综合色网站| 亚洲成色www久久网站| 成人毛片视频免费看| 日韩精品午夜视频| 久久久最新网址| 黄色精品视频在线观看| 要久久爱电视剧全集完整观看| 88在线观看91蜜桃国自产| 黄色影院一级片| 色帝国亚洲欧美在线| 欧美韩国日本综合| 久久99国产精品99久久| 成人h动漫精品一区二区无码 | 国产精品爱久久久久久久| 一区二区视频免费看| 欧美日中文字幕| 日韩大片在线观看视频| 曰本三级日本三级日本三级| av成人亚洲| 一道本成人在线| 男人日女人逼逼| 欧美极品少妇videossex| 国产欧美精品国产国产专区| 免费观看成人在线| 秋霞网一区二区| 国产成人精品综合在线观看 | 综合网在线视频| 日韩亚洲视频在线| 欧美69xxxxx| 91丨九色丨尤物| 精品国产_亚洲人成在线| 成 人 黄 色 片 在线播放 | 波多野结衣福利| 精品欧美午夜寂寞影院| 91麻豆精品国产91久久久使用方法 | 欧美私人网站| 欧美韩国日本不卡| 亚洲高清123| wwwxxx在线观看| 国产欧美日本一区视频| 日韩欧美99| 成人h小游戏| 国产精品色眯眯| 亚洲一卡二卡三卡| 久草免费在线观看| 亚洲天堂精品在线观看| 国产精品久久久影院| 中文字幕在线观看播放| 夜色激情一区二区| 国产美女主播在线| 免费看男女www网站入口在线| 亚洲国产aⅴ天堂久久| 黄色激情在线视频| 亚洲v.com| 欧美在线看片a免费观看| 精品久久久久久无码国产| 成人国产精品| 欧美一区二区三区婷婷月色| 韩国三级在线看| 久久香蕉网站| 亚洲午夜小视频| 国产美女网站视频| 亚洲乱码电影| 国内精品视频久久| 无码人妻丰满熟妇精品区| 日韩黄色免费网站| 91久久国产精品| 欧美自拍偷拍一区二区| 久久蜜桃av一区精品变态类天堂 | 欧美13一16娇小xxxx| 亚洲欧美日韩在线| 黄网站欧美内射| 456成人影院在线观看| 欧美精品在线观看播放| 成人啪啪18免费游戏链接| 亚洲盗摄视频| 久久精品国产成人| 亚洲第一精品在线观看| 蜜臀av性久久久久蜜臀av麻豆| 91网站免费看| 欧美日韩伦理片| 中文字幕一区二区三区精华液| 亚洲一区二区三区av无码| 周于希免费高清在线观看| 欧美人体做爰大胆视频| 欧美熟妇精品一区二区蜜桃视频| 久久91精品| 欧美日本精品在线| 波多野结衣在线电影| 国产一区 二区 三区一级| 久久久综合亚洲91久久98| 黄色网址在线免费播放| 日韩欧美国产一区二区| 亚洲一区二区三区四区精品 | 亚洲精品无人区| 福利在线导航136| 欧美色涩在线第一页| 麻豆精品国产传媒av| 四虎8848精品成人免费网站| 午夜精品免费视频| 国产夫绿帽单男3p精品视频| 国产日产欧美一区二区三区| 99在线免费视频观看| 狠狠久久综合| 亚洲欧洲日产国码av系列天堂| 亚洲av无码一区二区三区在线| 丝袜诱惑制服诱惑色一区在线观看| 91观看网站| yw在线观看| 欧美视频一区二区三区…| 欧洲成人午夜精品无码区久久| 精品产国自在拍| 98精品国产高清在线xxxx天堂| 国产农村妇女毛片精品| 国产精品色哟哟网站| 国产精品亚洲αv天堂无码| 91精品尤物| 久久在线免费视频| 国产又大又黄又爽| 国产精品三级视频| 日本美女高潮视频| 国产精品一区2区3区| 97成人精品视频在线观看| 亚洲av无码国产精品久久不卡| 国产精品久久久爽爽爽麻豆色哟哟| 国产免费成人在线| 日韩电影不卡一区| 992tv成人免费影院| 欧美 中文字幕| 亚洲大型综合色站| 日本一级大毛片a一| 欧美aa国产视频| 91国产在线播放| 色呦呦在线免费观看| 欧美一区二区三区四区高清| 欧美一级特黄高清视频| 美国欧美日韩国产在线播放| 亚洲一区二区三区精品视频| 成人网ww555视频免费看| 一本一本久久a久久精品牛牛影视 一本色道久久综合亚洲精品小说 一本色道久久综合狠狠躁篇怎么玩 | 欧美日韩国产精品一卡| 婷婷综合六月| 亚洲视频综合网| 日批视频免费观看| 综合久久久久久久| 男生和女生一起差差差视频| 欧美激情综合| 国产精品国模大尺度私拍| 中中文字幕av在线| 亚洲国产成人精品一区二区 | 日本动漫理论片在线观看网站| 欧美一区二区视频在线观看| 校园春色 亚洲| 东方aⅴ免费观看久久av| 国产v片免费观看| 香蕉久久夜色精品国产使用方法| 欧美亚洲第一区| 免费av在线电影| 欧美日韩国产影片| 久久激情免费视频| 91浏览器在线视频| 色婷婷.com| 激情亚洲网站| 日韩久久久久久久久久久久久| 欧美伊人亚洲伊人色综合动图| 久久亚洲国产成人| 人妻妺妺窝人体色www聚色窝| 欧美天堂在线观看| 我要看一级黄色录像| 顶级嫩模精品视频在线看| 国产精品动漫网站| 亚洲国产一区二区在线观看 | 国产精品久久久久久久久久久新郎 | 欧美另类在线观看| 亚洲欧美日韩动漫| 欧美蜜桃一区二区三区| 国产在线视频你懂的| 久久精品一级爱片| 一起草最新网址| 日韩精品欧美精品| 久久综合久久网| 日韩av在线中文字幕| 91九色蝌蚪成人| 一二区成人影院电影网| 欧美日本中文字幕| 成人精品一区二区三区免费| 亚洲第一av网| 92久久精品一区二区| 午夜不卡在线视频| 青青草原在线免费观看| 国产日韩欧美制服另类| 不许穿内裤随时挨c调教h苏绵| 日韩精品一区第一页| 高清无码一区二区在线观看吞精| 国产精选一区| 黄色国产精品一区二区三区| 电影91久久久| 国产精品美女无圣光视频| 国产精品xx| 欧美老女人性视频| 免费a在线看| 亚洲偷欧美偷国内偷| 四季av日韩精品一区| 日韩写真欧美这视频| 在线观看色网站| 在线精品视频免费播放| 中文字幕亚洲高清| 亚洲一级二级在线| 老熟妇高潮一区二区三区| 国产亚洲一区二区三区四区| 免费看黄色片的网站| 国产美女在线精品| 五月婷婷六月丁香激情| 狂野欧美性猛交xxxx巴西| 蜜臀av色欲a片无码精品一区| 亚洲精彩视频| 中文字幕在线观看一区二区三区| 国产一区二区精品福利地址| 久久精品国产精品青草色艺| 亚洲综合网站| 99精品国产高清一区二区| 久久久国产精品入口麻豆| 国产欧亚日韩视频| 97成人超碰| 国产精品香蕉在线观看| 电影一区二区| 国产精品网站入口| 久久91超碰青草在哪里看| 国产精品福利观看| 日日av拍夜夜添久久免费| 国产精品18久久久久久麻辣| 国产精品扒开腿做爽爽爽视频软件| 992tv成人免费影院| 午夜激情电影在线播放| 欧美在线性爱视频| 国偷自产一区二区免费视频| 日韩暖暖在线视频| 欧美与亚洲与日本直播| 国产精品久久久久久久久久小说| 自拍偷自拍亚洲精品被多人伦好爽| 日韩女在线观看| a屁视频一区二区三区四区| 国产精品最新在线观看| 美女久久久久久| 91色视频在线导航| 中文字幕一区二区三区四区久久| 国产高清自拍一区| 亚洲bt欧美bt精品777| 日韩亚洲视频在线| 香蕉综合视频| www.好吊操| 国产日韩亚洲| 欧美日韩在线观看不卡| 精品写真视频在线观看| 欧美一级片在线免费观看| 成人精品一区二区三区中文字幕| 久久午夜夜伦鲁鲁片| 国产欧美一区二区精品婷婷| 五月综合色婷婷| 婷婷久久综合九色国产成人| 一级黄色大片视频| 欧美日韩高清一区二区| www国产一区| 国产视频欧美视频| 米奇精品一区二区三区| 欧美激情亚洲国产| 午夜欧美巨大性欧美巨大| 国产日韩欧美综合| 久久资源综合| 亚洲精品一区二区三| 国产综合婷婷| 国产无套粉嫩白浆内谢的出处| 精品一区二区免费视频| 亚州av综合色区无码一区| 国产欧美日本一区视频| 少妇影院在线观看| 一本久久a久久精品亚洲| 国产欧美久久久| 亚洲区在线播放| 高清电影在线观看免费| 国产精品中文在线| 超碰成人免费| 亚洲精品一卡二卡三卡四卡| 国产一级一区二区| 91香蕉国产线在线观看| 久久亚洲综合色| 精品无码人妻一区二区三区| 欧美性高清videossexo| 天天干天天摸天天操| 久久影视电视剧免费网站| 欧美片第一页| 国产免费一区二区| 国产精品国内免费一区二区三区| 欧美亚洲一二三区| 国产高清一区日本| 成人信息集中地| 日韩欧美在线免费| 人妻91麻豆一区二区三区| 久久国产精彩视频| 欧美大陆国产| 日韩成人av网站| 国产日韩1区| 美女黄色一级视频| 亚洲欧美一区二区三区国产精品| 黄色一级视频免费看| 亚洲第一综合天堂另类专| av网站在线免费| 国产精品爽黄69| 精品国产一区二区三区久久久蜜臀| 精品少妇在线视频| 国产精品一区二区在线看| 99热6这里只有精品| 在线视频你懂得一区| 青青草免费在线视频| 88xx成人精品| 久久1电影院| 欧美深夜福利视频| 成人av网址在线| 久久黄色免费视频| 欧美成人一区二区三区片免费 | 亚洲av片在线观看| 国模吧一区二区| 国产精品极品国产中出| 91亚洲精品国产| 国产高清不卡一区| 美女视频黄免费| 精品国产伦理网| a'aaa级片在线观看| 国产日韩精品久久| 亚洲三级毛片| 国产亚洲色婷婷久久99精品91| 午夜国产不卡在线观看视频| 香蕉视频黄在线观看| 欧美一区在线直播| 国产成人高清| 欧美少妇性生活视频| 国产欧美综合在线观看第十页| 无码一区二区三区| 深夜福利国产精品| 在线观看亚洲精品福利片| 97超碰人人爱| 国产成人在线免费| 日韩美女一级片| 日韩电影免费在线观看中文字幕 | 国产精品s色| 国产国语老龄妇女a片| 欧美日韩国产一区中文午夜| 日本国产在线| 国产精品视频yy9099| 99久久夜色精品国产亚洲1000部| 911av视频| 亚洲第一福利视频在线| 日本大片在线观看| 国产精品久久久久久久久久小说 | 国产精品久久久爽爽爽麻豆色哟哟 | 美日韩精品免费| 日本va欧美va欧美va精品| 九九热视频在线免费观看| 欧美成人vps| 波多野结衣亚洲| 中文字幕一区二区三区精彩视频| 成人综合在线视频| 成年人视频免费| 久久天天躁狠狠躁夜夜躁| 国产欧美啪啪| 亚洲三级视频网站| 夜夜嗨av一区二区三区四季av| 三区在线视频| 成人在线视频网| 在线视频免费在线观看一区二区| 久久久久亚洲AV成人无在| 日韩欧美在线综合网| 精品91久久| 青青视频免费在线观看| 久久久久久久久久久黄色| 国产高清视频免费| 国产成人极品视频| 亚洲国产精品成人| 久久只有这里有精品| 日韩欧美一二三四区| 外国电影一区二区| 久草免费福利在线| 国产精品美女一区二区三区 | 激情伊人五月天| **性色生活片久久毛片| 五月婷婷六月丁香综合| 亚洲已满18点击进入在线看片| 免费视频久久| 精品久久免费视频| 久热精品在线视频|