精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Prompt自相矛盾,大模型能發現嗎?上海交通大學最新研究解密 | ECCV 2024

人工智能 新聞
在最新的這項研究中,團隊提出了多模態基準測試——自相矛盾指令集,并設計了一個創新的自動數據集創建框架,名為AutoCreate。

上海交通大學王德泉教授課題組在最新研究中提出了這樣的一個問題。

設想這樣一個場景:一個幼兒園的小朋友拿著一張老虎的圖片,向你詢問:“這個小貓很可愛,它是一只母貓么?”你會如何回答?

你可能并不會直接回答“是”或“不是”,而是首先指出這個提問中的“矛盾”所在——這張圖片是一只老虎,而不是貓

圖片

但關于大模型會怎樣應對,之前很少有系統性的研究。

要知道,無法檢測出“指令沖突”的AI模型會針對“不應該有答案的問題”生成結果,而無論生成的結果偏向于沖突的哪一方,都會引發潛在的災難,影響AI安全性以及Superalignment(超級對齊)

在最新的這項研究中,團隊提出了多模態基準測試——自相矛盾指令集,并設計了一個創新的自動數據集創建框架,名為AutoCreate

團隊發現多模態大模型對于自相矛盾的用戶指令的檢測非常欠缺,因此提出了認知喚醒提示方法(CAP),從外部世界注入認知能力從而提高了矛盾檢測的能力。

該論文即將發表在今年10月份的第18屆歐洲計算機視覺大會(ECCV)上。

圖片

大模型能檢測到沖突指令嗎?

目前,多模態大模型在科研和應用領域取得了巨大的進展。它們能夠處理包括文本、圖像在內的多種數據類型,顯示出與人類認知相似的能力。

團隊認為這些模型的成功得益于大量的研究和開發工作,使它們能夠緊密遵循人類的指令,甚至有些“唯命是從”。

此外,這些模型還特別擅長于長上下文。多模態大模型如Claude 3和Gemini 1.5 Pro等,已經展示出強大的能力。Claude 3系列模型提供了200K tokens的上下文窗口,Gemini 1.5 Pro的標準上下文窗口大小為128K,甚至在私人預覽階段可以達到1M tokens。

這些進展使得多模態大模型在處理復雜任務方面表現出色,滿足了人類長時間互動的需求。

然而,隨著多模態交互的深入、上下文長度的增加,用戶指令自相矛盾的問題變得越來越突出。

如下圖,當用戶(如兒童或語言初學者)使用這些模型時,往往無法意識到潛在的多模態沖突。

圖片

同時,隨著對話輪次的增加和上下文窗口的擴大,用戶難以記住所有細節,導致指令間的矛盾。

此外,隨著模態數量的增加,模態間的沖突也可能發生。一旦這些模型缺乏自我意識和辨別矛盾的能力,其性能就會受到影響。

為了應對這些挑戰,本文研究團隊提出了一個多模態基準測試——“自相矛盾指令集(Self-Contradictory Instructions, SCI),用于評估多模態大模型檢測沖突指令的能力。

SCI包含2萬個沖突指令8個任務,均勻分布在語言-語言視覺-語言兩種范式中。

在圖中的上部分,語言-語言范式涉及上下文和指令之間的沖突,如設計的規則沖突、對象屬性沖突、排他性指令和禁止詞匯。

圖片

在圖中的下部分:視覺-語言范式涵蓋多模態沖突,如OCR文字識別沖突、圖表沖突、幾何沖突和語義沖突。八個任務中,只有語義沖突涉及到了其他的數據集(ImageNet)

舉一個具體的例子來說,在構建語義沖突時,研究人員會首先根據圖片生成對應的文本,隨后將文本中的關鍵語義信息替換成相近但是不同的新語義。

在下圖中,圖片中包含了鴕鳥(Ostrich),作者針對圖片語義“鴕鳥”添加問題“Does the picture depict the ostrich’s size?”。

隨后,再對這個問題文本的關鍵語義“鴕鳥”替換為“幾維鳥”(Kiwi)。這樣一來,一對自相矛盾的多模態指令就構建好了。

圖片

在整個SCI的構建過程中,作者設計了創新的自動數據集創建框架——AutoCreate

它通過程序和大語言模型構建了一個多模態循環。該框架利用程序和大型語言模型來實現自動化的數據集創建。

AutoCreate從若干與任務相關的種子數據開始,并維護一個種子池。在每個周期內,AutoCreate包括兩個分支:語言分支(左)視覺分支(右)。每個分支都由生成器和修飾器組成。

圖片

最后,清理器將排除不符合標準的數據。這些數據在通過人工專家的質量檢查后,將被反饋到種子池中,供下一輪使用。

AutoCreate大大提升了SCI數據集的構建速度和內容廣度。

怎樣提高矛盾檢測能力?

通過SCI數據集,研究人員全面評估了大模型在處理矛盾指令時的表現。

實驗結果表明,當前的大模型在面對自相矛盾的指令時,常常表現出一定的不足。

它們能夠處理信息和知識,但缺乏對指令合理性的評估能力,研究團隊稱之為的“認知”能力。

這種缺陷源于缺乏自我意識,無法識別指令中的不一致性。

因此,研究人員提出了一種簡單的插入式提示方法,稱為“認知覺醒提示(Cognitive Awakening Prompting, CAP)

CAP通在輸入中加一句簡單的提示,就可以從外部世界注入認知能力,從而提高大模型的矛盾檢測能力,并且基本不會產生負面影響。

這一發現表明,當前多模態大模型需要更多的自我意識和認知能力,以便更好地處理復雜的指令沖突。

圖片

更多細節,感興趣的童鞋可以查看原論文。

作者簡介

論文第一作者是上海交通大學博士研究生郜今

他的研究方向包括計算機視覺、多模態大模型、人工智能賦能的生命科學等。

圖片

論文的通訊作者為上海交通大學長聘教軌助理教授、博士生導師王德泉,他本科畢業于復旦大學,博士畢業于加州大學伯克利分校,師從 Trevor Darrell 教授。

他的研究工作發表在CVPR、ICCV、ECCV、ICLR、ICML、ICRA、IROS等國際頂級會議,近五年論文谷歌學術總引用次數10000余次,H-index 20。

論文鏈接:https://arxiv.org/abs/2408.01091
項目鏈接:https://selfcontradiction.github.io/

責任編輯:張燕妮 來源: 量子位
相關推薦

2009-08-17 09:21:02

喬布斯

2018-04-11 09:29:34

加密貨幣存儲流通

2025-08-18 09:00:00

大模型AILLM

2025-07-28 09:06:00

2022-08-20 18:33:08

開源代碼模型

2024-09-09 08:30:00

2025-02-17 08:43:00

模型推理訓練

2010-02-06 09:15:14

ACMICPC

2025-11-06 08:45:00

AI語言模型算法

2025-04-25 09:22:44

2024-05-22 09:22:13

2025-02-03 12:21:51

2024-11-04 10:20:00

模型數據

2022-04-18 15:13:40

機器視覺神經網絡研究

2025-10-28 09:03:08

2024-12-23 13:30:00

2025-05-26 09:21:00

2025-04-15 12:14:10

2025-06-04 13:51:43

視頻生成模型
點贊
收藏

51CTO技術棧公眾號

国产精品久久一卡二卡| 久久久精品日韩| 精品视频偷偷看在线观看| 成熟了的熟妇毛茸茸| 国产高清免费在线播放| 国内精品写真在线观看| 91精品国产91久久久久久吃药 | 亚洲日本在线观看视频| 亚洲欧洲成人av每日更新| 国产在线精品一区二区三区| 无码任你躁久久久久久久| 中文字幕午夜精品一区二区三区 | 国产成人福利视频| 麻豆明星ai换脸视频| 一区二区三区视频播放| 色哟哟在线观看一区二区三区| 欧美一级日本a级v片| xxxx国产精品| 免费视频最近日韩| 韩日欧美一区二区| 手机在线免费看片| 久操国产精品| 精品久久人人做人人爽| 性chinese极品按摩| 黄色在线免费观看网站| 国产精品人人做人人爽人人添 | jizzjizz欧美69巨大| 精品少妇一区二区三区在线播放| 黑森林精品导航| 日韩激情电影免费看| 亚洲一区二区综合| 中文字幕日韩精品久久| 成人全视频高清免费观看| 成人网在线播放| 亚洲在线视频观看| 在线观看毛片视频| 丝袜诱惑亚洲看片| 午夜精品一区二区三区av| 国产黄在线免费观看| 日韩精品影视| 在线免费看av不卡| 一区二区三区伦理片| 啪啪国产精品| 亚洲国产成人av在线| 国产性猛交96| 57pao国产一区二区| 91精品国产综合久久国产大片| 久久久久免费精品| 亚洲天堂一区二区| 日韩欧美一区二区三区| 久久美女福利视频| 亚洲欧美一区二区三区| 亚洲成a人片综合在线| 男人j进女人j| 亚洲婷婷噜噜| 亚洲综合色网站| 国产黄色激情视频| 免费在线观看的电影网站| 一区二区三区影院| 国产一线二线三线女| 黄网站在线观| 亚洲成人1区2区| 播放灌醉水嫩大学生国内精品| 国产自产自拍视频在线观看| 亚洲国产日韩综合久久精品| 草b视频在线观看| 黄频免费在线观看| 91福利视频网站| 中文字幕有码av| 亚洲三级电影| 欧美一级久久久久久久大片| 韩国三级在线看| 久久99国产精品久久99大师| 日韩精品久久久久久福利| 久久久亚洲av波多野结衣| 视频一区在线观看| 久久精品男人天堂| 国产亚洲精品久久久久久无几年桃 | 香蕉视频亚洲一级| 欧美日韩国产小视频在线观看| 亚洲制服中文字幕| 超碰成人在线免费| 亚洲欧美日韩在线高清直播| 妖精视频在线观看免费| 一区二区在线| 91精品国产九九九久久久亚洲| 黄色片中文字幕| 久久国内精品视频| 99视频在线播放| 青青久在线视频免费观看| 国产精品久久久久三级| 精品人妻人人做人人爽| 欧美xoxoxo| 717成人午夜免费福利电影| 成人欧美精品一区二区| 激情五月色综合国产精品| 久久视频在线观看免费| 一级片中文字幕| 久久99精品久久久久久久久久久久| y111111国产精品久久婷婷| 日韩在线无毛| 亚洲精品菠萝久久久久久久| 男女高潮又爽又黄又无遮挡| 国产不卡精品在线| 亚洲欧美综合另类中字| 久久精品黄色片| 另类av一区二区| 99国产超薄丝袜足j在线观看| 你懂的视频在线播放| 亚洲日本成人在线观看| 虎白女粉嫩尤物福利视频| 日韩免费一级| 久久精品国产成人精品| 狠狠人妻久久久久久综合| 国产精品伊人色| 亚洲成人一区二区三区| а√天堂8资源中文在线| 欧美一区欧美二区| 国产视频三区四区| 亚洲欧美bt| 成人欧美一区二区三区视频xxx| av影片在线看| 欧美日韩亚洲一区二| 香蕉视频1024| 香蕉综合视频| 国产精品欧美久久久| 神马久久精品| 午夜欧美在线一二页| 又黄又爽又色的视频| 成人在线一区| 国产精品www色诱视频| 亚洲人成色777777老人头| 亚洲一区二区欧美激情| 久久精品一卡二卡| 久久国产成人精品| 日韩av电影在线播放| 亚洲欧洲视频在线观看| 精品久久久久久中文字幕| 国产麻豆剧传媒精品国产| 91精品久久久久久久久久不卡| 国产mv久久久| 邻居大乳一区二区三区| 欧美性xxxx| 亚洲激情视频小说| 亚洲永久字幕| 欧美日韩亚洲在线| 韩国美女久久| 亚洲一区二区福利| 国产成人自拍偷拍| 日本一区二区成人| 日韩爱爱小视频| 999国产精品永久免费视频app| 国产精品久久视频| 在线看黄色av| 538prom精品视频线放| 91麻豆免费视频网站| 精品写真视频在线观看| 欧美做受777cos| h视频久久久| 97涩涩爰在线观看亚洲| 秋霞av在线| 日韩欧美在线第一页| www.色天使| 免费成人在线观看| 日本高清xxxx| 国产成人精品亚洲线观看| 性欧美激情精品| 国产在线视频福利| 欧美人体做爰大胆视频| 侵犯稚嫩小箩莉h文系列小说| 国产麻豆精品视频| 97中文字幕在线| 亚洲最好看的视频| 国产精品偷伦视频免费观看国产| 免费av网站在线看| 精品国产一区二区三区忘忧草| 日本在线视频中文字幕| 国产色91在线| 三级网站免费看| 国产一区二区三区成人欧美日韩在线观看| 鲁丝片一区二区三区| 日韩美女在线| 国产69精品久久久| 成人在线二区| 欧美tk丨vk视频| 无码人妻丰满熟妇奶水区码| 国产精品久久久久久久久快鸭| 特种兵之深入敌后| 久久国产精品亚洲77777| 秋霞在线一区二区| 青青一区二区| 成人精品视频在线| 国产在线天堂www网在线观看| 中文字幕亚洲综合久久筱田步美| 亚洲男人天堂久久| 欧美视频在线播放| 国产成人愉拍精品久久 | 亚洲欧美日韩综合一区| 综合欧美亚洲| 国产精品久久久久久久久久久久久| www久久日com| 亚洲女在线观看| www香蕉视频| 欧美三级电影在线看| 国产对白videos麻豆高潮| 国产精品嫩草99a| 800av在线播放| 国产自产v一区二区三区c| 农村妇女精品一二区| 国内精品99| 五月天综合婷婷| av在线不卡顿| 久久精品国产99精品国产亚洲性色| 在线播放成人| 国产精品久久久久久久久免费看| 超免费在线视频| 北条麻妃久久精品| 国产露出视频在线观看| 亚洲国产美女久久久久| 国产女人18毛片水真多| 欧美色网站导航| 99久久久久久久久| 精品久久久久久亚洲精品| 久久艹精品视频| 综合激情成人伊人| 国产综合精品久久久久成人av| 91视频你懂的| 天天躁日日躁狠狠躁av| 国产一区二区不卡在线| 伊人网在线综合| 日本不卡中文字幕| 88av.com| 一级黄色片在线观看| 天天干,夜夜爽| 国产欧美日产一区| 黄色国产在线视频| 国产成人免费视频一区| 亚洲黄色小视频在线观看| 国产日韩1区| 亚洲熟妇av一区二区三区漫画| 黄色成人在线网址| 国产一级黄色录像片| 亚洲蜜桃视频| 日本一本草久p| 久久精品影视| 乱子伦一区二区| 欧美成人日韩| 特级西西人体www高清大胆| 亚洲精品极品少妇16p| 自拍偷拍99| 亚洲国产精品日韩专区av有中文| 天天综合狠狠精品| 日韩成人综合| 伊人久久av导航| 国产精品毛片久久| 看全色黄大色大片| 国产精品jizz在线观看美国| 精品视频在线观看一区二区| 国产精品九九| 浮妇高潮喷白浆视频| 亚洲一区二区三区高清| 国产精品69页| 美女视频一区二区三区| 久久精品国产露脸对白| 国产一区二区三区精品视频| 韩国三级hd中文字幕有哪些| 成人网在线播放| 国产伦精品一区二区三区妓女| 91麻豆成人久久精品二区三区| 亚洲精品理论片| 中国色在线观看另类| 性欧美疯狂猛交69hd| 亚洲午夜影视影院在线观看| 97免费在线观看视频| 欧美性videosxxxxx| 国产乱码精品一区二区三区精东| 日韩欧美区一区二| 性感美女一级片| 中文字幕在线观看日韩| 91网在线看| 欧美一级片在线播放| 国产精品成人国产| 99久久伊人精品影院| 亚洲理论电影| 成人在线免费观看网址| 一二三区精品| 又色又爽又黄视频| 99久久精品情趣| 五月婷婷综合激情网| 亚洲成人av福利| 888奇米影视| 亚洲精品久久久久久下一站 | 国产成人亚洲精品青草天美| 欧洲一级黄色片| 亚洲精品久久久久久国产精华液| 成年免费在线观看| 欧美日韩成人在线| 亚洲aaa在线观看| 欧美成人黑人xx视频免费观看| 黑人巨大亚洲一区二区久| 亚洲综合中文字幕68页| 国产探花在线精品| a级黄色片免费| 寂寞少妇一区二区三区| 国精产品一区一区三区免费视频| 亚洲色图丝袜美腿| 无码人妻久久一区二区三区| 精品国偷自产国产一区| 色欧美激情视频在线| 日本精品性网站在线观看| h视频久久久| 亚洲精品偷拍视频| 日韩综合小视频| 日韩aaaaa| 亚洲制服欧美中文字幕中文字幕| 在线观看国产精品入口男同| 亚洲男子天堂网| 9999精品成人免费毛片在线看| 91麻豆桃色免费看| 成人情趣视频| 日韩无套无码精品| 91在线高清观看| 日本少妇性高潮| 欧美成人官网二区| 超碰在线网址| 成人国产在线视频| 色综合久久网| 污版视频在线观看| 国产日产欧产精品推荐色| 国产剧情在线视频| 日韩激情av在线免费观看| 国产天堂在线播放视频| 99在线高清视频在线播放| 欧美第一精品| 五月天婷婷亚洲| 国产精品久久久久久久久免费桃花 | 成人免费网视频| 色999国产精品| 欧美女同在线观看| 国产精品女主播av| 伊人网综合在线| 色999日韩欧美国产| 国产精品久久久久77777丨| 日韩国产欧美一区| 日韩专区在线视频| 91麻豆精品国产91久久综合| 在线欧美一区二区| fc2在线中文字幕| 国产精品丝袜久久久久久高清 | 在线观看中文字幕亚洲| 亚洲www啪成人一区二区| 欧洲成人一区二区| 蜜桃av一区二区在线观看| 国产又粗又长免费视频| 欧美日韩大陆一区二区| 成人黄色在线电影| 91在线观看免费高清| 午夜久久99| 老熟妇精品一区二区三区| 疯狂做受xxxx高潮欧美日本| 嫩草在线播放| 国产精品在线看| 欧美成人久久| 三级黄色片网站| 在线观看视频91| 毛片在线播放a| 成人免费视频网站| 一区二区三区四区五区精品视频| 久久久久久久久久久国产精品| 欧美系列亚洲系列| 天堂8中文在线| 蜜桃网站成人| 久久精品国产99| 国产亚洲成人精品| 日韩精品一二三四区| 国产成人精品一区二区三区视频| 好吊色视频988gao在线观看| 99视频一区二区| 中文字幕你懂的| 美乳少妇欧美精品| 色狠狠久久av综合| jizz欧美性11| 亚洲国产毛片aaaaa无费看| 美州a亚洲一视本频v色道| 成人福利视频在线观看| 亚洲国产一区二区三区a毛片| 亚洲天堂视频一区| 制服丝袜亚洲精品中文字幕| 国产美女高潮在线观看| 亚洲一区二区精品在线观看| 丁香婷婷综合色啪| 瑟瑟视频在线免费观看| 色综合久久88| 日本欧美国产| 国产真实乱人偷精品| 欧美日韩视频在线第一区 | 一区二区三区久久久| 成年人在线观看网站| 国产精品一区免费观看| 久久99九九99精品|