精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

生活機器人最后考驗!楊笛一團隊發布EgoNormia:現實中能否符合社會規范?

人工智能 新聞
EgoNormia基準可以評估視覺語言模型在物理社會規范理解方面能力,從結果上看,當前最先進的模型在規范推理方面仍遠不如人類,主要問題在于規范合理性和優先級判斷上的不足。

隨著人工智能技術日益成熟,社會各界對AI或機器人能否學習并遵循社會規范的問題越來越關注。從早期的科幻小說到如今的現實應用,人類始終期望機器能夠理解并內化這些根植于社會生活中的「規范」。

隨著視覺語言模型(VLMs)不斷進步,研究者們陸續推出了諸多基準和數據集,用以評估其第一視角下的視頻理解能力。例如,HourVideo和EgoSchema等基準主要關注長視頻解析以及對物體和事件的識別能力。

然而,這些評估工具難以衡量模型在規范推理(normative reasoning)方面的表現,為此,斯坦福大學團隊提出了EgoNormia基準,旨在挑戰當前最前沿的視覺語言模型,促使它們在復雜場景中做出符合人類常識的規范決策。

圖片

論文鏈接:https://arxiv.org/abs/2502.20490

網頁鏈接:https://egonormia.org

代碼鏈接:https://github.com/Open-Social-World/EgoNormia

在現實生活中,人們做決策時遇到的情境往往充滿矛盾與取舍。

例如:在戶外遠足的時候,如果一位同伴在泥濘中被困;一方面,安全規范要求人們保持足夠距離,以防發生意外;另一方面,協作精神又促使人們對同伴伸出援手。

對于人類來說,這樣的權衡似乎是自然而然的選擇,人們會在保護自己安全的前提下向同伴施以援手;但對于視覺語言模型來說,如何在理解場景、提取關鍵線索的同時做出合乎社會規范的決策,仍然是一個亟待攻克的難題。

圖片

為全面衡量視覺語言模型在規范推理上的能力,論文主要提出了以下研究問題:

  • RQ1:模型是否能做出與人類共識一致的規范決策?
  • RQ2:當模型決策與人類不符時,究竟是因為視覺感知(如物體識別)出現偏差,還是在深入推理規范時存在缺陷?
  • RQ3:是否可以借助 EgoNormia 數據集來提升模型在復雜情境下的規范推理表現?

Physical Social Norm

為了更好地研究規范,論文首先將物理社會規范做出了以下定義:

「物理社會規范(Physical Social Norm)是指在共享環境中約定俗成的期望,這些期望規范著行為者的行為及其與他人的互動方式。」

同時,論文也對于物理社會規范進行了分類,有一類規范明確用于最大化多智能體系統的整體效用,論文稱之為效用規范,即合作、協調和溝通規范。

另一類規范則更側重于人類社會性:安全、禮貌、隱私和空間距離。

人類社會規范往往與群體效用規范存在沖突,這種沖突為評估智能體在沖突目標下的決策提供了場景。重要的是,每一類物理社會規范都能直接影響人機協作的成功,每一種規范具體的例子如下圖。

圖片

任務

EgoNormia基準主要包含三個子任務,所有子任務均采用多項選擇題的形式。

子任務1:動作選擇,選出在當前情境下最符合規范要求的唯一動作。

子任務2:理由選擇,選出最能支持其所選規范動作的理由。

子任務3:動作合理性判斷,從給定選項中選出那些合理的(即符合規范但不一定是最佳的)動作。

圖片

基準生成

EgoNormia基準生成流程主要包含四個階段:片段采樣,答案生成,篩選,人工驗證。這些流程保證了最終數據集保持了多樣性,挑戰性,和人工共識性。

經過一系列流程,論文最終得到了來自1077個原始視頻的1853個視頻切片,涵蓋97種場景和93種不同動作。

借助GPT-4o的自動聚類技術,所有視頻被歸納為 5 個高層級類別和 23 個低層級類別,充分展示了數據的多樣性和豐富性(詳見餅圖)。

圖片

實驗結果

在EgoNormia的評估中,大多數模型的平均準確率均低于40%,而人類的平均得分高達92.4%,表現最好的模型Gemini 1.5 Pro在取得了45.3%的平均準確率,表明當前模型在做具體現身的規范決策(RQ1)方面能力有限。

此外,即便使用了更豐富的文本描述和最先進的推理模型如 o3-mini,表現仍然不及采用視覺輸入的模型,證明了語言在捕捉連續、推理中細微特征(如空間關系、可見情緒與情感以及物理動態)方面存在根本性局限。

圖片

為了探究視覺語言模型規范推理能力受限的原因(RQ2),論文對 EgoNormia 中 100 個具代表性任務的模型回復進行了標注,并進一步將規范推理錯誤進行了分類。

論文共識別出四種失敗模式:(1) 規范合理性錯誤,(2) 規范優先級錯誤,(3) 感知錯誤,以及 (4) 拒絕回答。

對于模型而言,大多數錯誤源自合理性錯誤而非感知錯誤,這表明基礎模型在處理視頻輸入的視覺上下文方面表現尚可,但在對解析出的情境進行有效規范推理時則存在不足。此外,隨著整體性能的提高,規范優先級錯誤的比例也逐步增加(GPT-4o < Gemini 1.5 Pro < 人類),表明更強大的模型在面對模棱兩可的情境時,更難確定哪項規范應當優先。

圖片

最后,研究人員評估了EgoNormia是否可以直接用于提升視覺語言模型的規范推理能力(RQ3)。

研究人員提出采用檢索增強生成(Retrieval-Augmented Generation,RAG),為更深層次的規范推理任務提供基于上下文的規范示例,使其能作為多示例學習的參考。

為了公平地測試EgoNormia在新數據上的效用,研究人員構建了一個基于第一人稱機器人助手視頻的域外測試數據集,基線GPT-4o的得分僅為18.2%。

通過對EgoNormia的檢索,論文展示了在未見域內任務上,相對于最佳非RAG模型和基礎GPT-4o,EgoNormia提供了9.4%的性能提升,并比隨機檢索 EgoNormia 提高了7.9%。

總結

EgoNormia是一種新穎的基準和數據集,旨在嚴格評估視覺語言模型(VLMs)在第一人稱視角下的物理社會規范(PSN)的理解能力。

論文證明,盡管當前最先進的模型在視覺識別和抽象推理方面表現強勁,但在PSN理解上仍然遜色于人類,主要原因在于規范合理性理解和優先級判斷上的錯誤。

通過測試一種基于檢索的方法,論文展示了EgoNormia在提升規范理解方面的直接實用性,在域外和不同體現的視頻上均取得了改進。

最后,論文還指出了具體現身規范理解未來的研究機遇,并建議在大規模規范數據集上進行后續訓練,這將是一個極具前景的研究方向。

部分作者介紹

楊笛一:斯坦福大學計算機系的助理教授,主要關注具有社會意識的自然語言處理,其研究目標是深入理解社會語境下的人類溝通,并開發支持人與人及人機交互的語言技術。

朱昊:斯坦福大學計算機系博士后,卡內基梅隆大學博士,專注于打造能夠學習與人類溝通和協作的人工智能代理。

張彥哲:佐治亞理工學院計算機系博士生,致力于使模型具備持續學習多任務并實現知識遷移的能力,以及使模型能夠從其他模態和人類中受益并為其服務。

伏奕澄:斯坦福大學電氣工程系碩士生,特別關注如何將大規模語言模型應用于現實場景,并致力于開發能夠更高效地與人類及外部世界進行交互的智能系統。

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-06-17 07:47:00

2025-04-02 09:50:00

機器人訓練數據

2023-03-13 09:35:07

ChatGPTAI

2022-01-04 10:19:23

架構運維技術

2023-05-09 12:27:52

亞馬遜微服務重構

2024-09-18 09:10:00

AI模型

2017-05-19 12:00:43

機器人家庭醫生YOBY

2024-04-09 08:36:01

2021-11-06 10:53:07

機器學習機器人AI

2020-03-26 21:59:50

機器人機器人警察人工智能

2025-06-27 09:33:38

2024-07-16 13:15:23

2020-08-18 19:24:17

機器人護理機器人人工智能

2009-12-16 09:52:15

Linux操作系統

2022-12-29 18:07:25

DDD電話機器人

2021-07-19 09:11:05

機器人人工智能算法

2022-03-21 13:38:42

機器人人工智能AI

2017-09-18 13:06:54

機器人AI人工智能

2021-07-26 21:31:13

機器人人工智能AI

2017-03-28 17:18:20

點贊
收藏

51CTO技術棧公眾號

影视一区二区三区| 暖暖视频在线免费观看| 午夜精品剧场| 亚洲电影免费观看高清完整版在线观看| 波多野结衣综合网| 色三级在线观看| 不卡一区二区三区四区| 国产精品久久久久久网站| 美女福利视频在线观看| 久久av免费看| 精品国产123| 少妇一级淫免费播放| 成年网站在线视频网站| 国产目拍亚洲精品99久久精品| 亚洲在线视频福利| 无码人妻aⅴ一区二区三区有奶水| 欧美va久久久噜噜噜久久| 欧美mv和日韩mv的网站| 日本人69视频| 日韩免费小视频| 午夜精品爽啪视频| 欧洲金发美女大战黑人| 成年人视频在线观看免费| 不卡的av网站| 97超碰资源| 亚洲天堂中文字幕在线| 欧美亚洲自偷自偷| 久久免费视频在线观看| 在线看的片片片免费| 美女精品一区最新中文字幕一区二区三区 | 手机在线理论片| 亚洲午夜免费视频| 伊人网在线免费| 免费观看在线午夜影视| 国产色综合一区| 精品一区二区三区自拍图片区| 精品久久在线观看| 国产综合色产在线精品| 国产精品一二三视频| 国产一级淫片a视频免费观看| 伊人久久久大香线蕉综合直播 | 久久精品aaaaaa毛片| 午夜精品久久久久久久99热黄桃| 欧美aaa在线| 国产精品久久久久77777| 日韩精品在线观看免费| 亚洲精品少妇| 51精品在线观看| 国产成人无码精品久在线观看| 欧美深夜福利| 欧美精品第一页在线播放| 爱爱视频免费在线观看| 中文一区一区三区免费在线观看| zzijzzij亚洲日本成熟少妇| 中文天堂资源在线| 成人vr资源| 视频直播国产精品| 搜索黄色一级片| 欧美在线首页| 久久久亚洲国产| 国产成人自拍视频在线| 亚洲精品黄色| 国产成人在线精品| 少妇无套内谢久久久久| 蜜臀a∨国产成人精品| 成人免费淫片视频软件| 国产人妖在线播放| 福利一区福利二区| 久久久久久久久一区二区| 免费黄网站在线观看| 国产三级欧美三级日产三级99| 日本福利一区二区三区| 91社区在线观看播放| 最好看的中文字幕久久| www.avtt| 三上悠亚一区二区| 欧美丰满嫩嫩电影| 国产高潮视频在线观看| 欧美日本成人| 久久视频在线直播| xxxxxx国产| 日韩高清中文字幕一区| 国产精品成人国产乱一区| 国产人妖一区二区三区| 91在线观看免费视频| 亚洲v欧美v另类v综合v日韩v| 国产欧美黑人| 欧美日韩午夜剧场| 中文字幕第100页| 盗摄系列偷拍视频精品tp| 日韩精品中文字| 99自拍视频在线| 国产精品亚洲综合久久| 国产日韩精品在线观看| 亚洲精品一区二区三区四区| 久久久蜜桃精品| 超碰10000| 中文字幕在线直播| 日韩一区二区高清| 欧美黄色激情视频| 国语自产精品视频在线看8查询8| 国产成人精品在线播放| 午夜精品在线播放| 国产精品免费看片| 国产 福利 在线| 国产专区精品| 伊人久久男人天堂| 日本中文字幕免费| 精品在线一区二区| 青青成人在线| heyzo在线播放| 欧美性色欧美a在线播放| 日韩精品国产一区| 无码一区二区三区视频| 国产福利精品在线| 瑟瑟在线观看| 亚洲图片欧美视频| 亚洲理论中文字幕| 欧美色网址大全| 91干在线观看| 亚洲成人一级片| 亚洲欧洲综合另类| 亚洲欧美国产日韩综合| 免费看日本一区二区| 欧美国产亚洲精品久久久8v| 亚洲一区二区人妻| 国产三级一区二区三区| 韩国日本在线视频| 欧美freesex8一10精品| 欧美丰满少妇xxxx| 精品国产九九九| 国产精品国产三级国产aⅴ入口 | 亚洲视频在线观看免费| 日韩精品视频免费播放| 粉嫩久久99精品久久久久久夜| 亚洲一区二区在线看| 日韩欧美少妇| 亚洲性夜色噜噜噜7777| 国产一级淫片a视频免费观看| 99精品国产91久久久久久 | 永久免费看mv网站入口| 九九视频精品免费| 五月天男人天堂| 日韩国产大片| 久久国产精品网站| www.四虎在线观看| 亚洲一区二区三区美女| 中文字幕18页| 一本一本久久| 久久久综合香蕉尹人综合网| 国产欧洲在线| 亚洲视频在线观看免费| 尤物视频免费观看| 国产精品三级久久久久三级| 日本久久久久久久久久久久| 超碰成人久久| 成人午夜黄色影院| 欧美日韩色网| 亚洲精品国精品久久99热| 久久亚洲精品国产| 欧美激情自拍偷拍| www.日本久久| 亚洲午夜视频| 久久亚洲一区二区| 深夜视频一区二区| 久久精品国产91精品亚洲 | 成人性生交大合| 久久亚洲中文字幕无码| 亚洲精品**不卡在线播he| 国产精品aaa| 嫩草在线视频| 亚洲成人久久久久| 久久精品五月天| 亚洲丝袜自拍清纯另类| 蜜臀av粉嫩av懂色av| 欧美亚洲专区| 天天综合五月天| 粉嫩精品导航导航| 国产精品99久久久久久www| 免费在线观看黄色网| 精品久久久久久久久久久久久久久| 日韩精品视频免费看| 中文字幕国产一区| 一区二区在线免费观看视频| 午夜在线a亚洲v天堂网2018| 亚洲精品美女久久7777777| 欧洲一区在线| 国产99久久精品一区二区| 国产在线一区二区视频| 亚洲精品999| 国产又粗又黄又爽视频| 五月天网站亚洲| 娇小11一12╳yⅹ╳毛片| 不卡免费追剧大全电视剧网站| 一区二区三区 日韩| 99精品视频免费观看| 中文字幕在线中文字幕日亚韩一区| 一区二区亚洲视频| 国产精品久久久久久久久久ktv | 欧美天堂在线观看| 亚洲av无一区二区三区| 久久综合给合久久狠狠狠97色69| 欧美大尺度做爰床戏| 亚洲精品女人| 激情图片qvod| 日韩大片在线播放| 精品国产乱码久久久久久丨区2区| 国产成人精选| 欧美亚洲国产另类| 午夜小视频在线观看| 这里只有精品在线观看| 香港一级纯黄大片| 日韩一区二区电影| 中文字幕永久在线观看| 欧美日韩亚洲网| 国产在线视频第一页| 亚洲女人****多毛耸耸8| 亚洲第一视频区| av欧美精品.com| 丰满饥渴老女人hd| 久久国产精品99久久久久久老狼 | 青娱乐av在线| 中文字幕一区二区三区在线播放 | 成人性生交大片免费看小说| xxx欧美xxx| 97成人精品视频在线观看| 最新超碰在线| 久久精视频免费在线久久完整在线看| 国产精品99999| 亚洲天堂第一页| 蜜桃成人在线视频| 亚洲片av在线| 免费在线黄色电影| 亚洲精品久久久久久久久久久 | 亚洲一品av免费观看| 天堂成人在线| 亚洲精品一区二区在线| 亚洲av成人精品一区二区三区在线播放 | 久青草国产在线| 日韩久久免费视频| 免费一级在线观看| 国产亚洲人成a一在线v站| 美州a亚洲一视本频v色道| 亚洲欧美激情在线视频| 男人久久精品| 色婷婷久久一区二区| 日韩成人影视| 中国日韩欧美久久久久久久久| av在线电影播放| 色七七影院综合| 成人黄色网址| 欧美疯狂xxxx大交乱88av| 国产丝袜在线观看视频| 久久久久久久网站| 日韩精品极品| 国产精品电影在线观看| 国产香蕉久久| 91久久精品国产91久久性色tv | 精品成人a区在线观看| 日本人妻丰满熟妇久久久久久| 日韩av中文字幕在线免费观看| 欧洲成人av| 日韩在线视频观看| 91国内在线| 91禁外国网站| av在线日韩| 91久久久一线二线三线品牌| 一区二区三区四区视频免费观看| 精品国产91亚洲一区二区三区www 精品国产_亚洲人成在线 | 中文字幕乱码在线| 国产视频一区二区在线| 少妇视频一区二区| 亚洲国产综合91精品麻豆| 亚洲另类在线观看| 欧美精选午夜久久久乱码6080| www.超碰在线.com| 亚洲人成绝费网站色www| 幼a在线观看| 午夜精品99久久免费| 亚洲承认视频| 91九色露脸| 精品一区不卡| 黄色一级片国产| 久久久青草婷婷精品综合日韩| 五月天婷婷影视| 99久久精品99国产精品| 蜜桃av免费在线观看| 亚洲国产日韩一级| 一本一道人人妻人人妻αv| 日韩视频在线永久播放| 国模吧精品人体gogo| 欧美猛交ⅹxxx乱大交视频| 97久久香蕉国产线看观看| 亚洲最大av网| 成人vr资源| 青青青青草视频| 久草热8精品视频在线观看| 黄色av网址在线观看| 亚洲日本va在线观看| 一级做a爰片久久毛片| 精品三级在线看| 婷婷五月在线视频| 欧美有码在线观看| 在线日韩成人| 青少年xxxxx性开放hg| 久久综合影音| 久久福利小视频| 一区二区日韩av| 亚洲中文字幕在线观看| 亚洲老司机av| 999精品网| aa成人免费视频| 欧美激情电影| 色一情一乱一伦一区二区三区日本| 成人爱爱电影网址| 男女羞羞免费视频| 欧美日韩二区三区| 国产精品久久久久久久龚玥菲| 欧美孕妇与黑人孕交| gogo久久日韩裸体艺术| 日本一二三区视频在线| 久久国产婷婷国产香蕉| 99久久久无码国产精品性| 午夜视黄欧洲亚洲| 国产91免费在线观看| 欧美另类在线观看| 电影一区中文字幕| 一区二区三区在线视频看| 美日韩精品视频| 老熟妇精品一区二区三区| 亚洲国产综合在线| 日本人妻丰满熟妇久久久久久| 欧美激情综合亚洲一二区| 一本一道久久a久久| 国产 欧美 日韩 一区| 国产一区二区三区四| 国产极品美女在线| 91精品国产综合久久久蜜臀粉嫩| 2017亚洲天堂1024| 国产日韩欧美视频| 国产精品99久久| 激情久久综合网| 亚洲欧美日韩国产一区二区三区 | 成人一道本在线| 久久久久香蕉视频| 日韩精品在线网站| 爱情岛亚洲播放路线| 国产专区一区二区| 久久精品观看| 成人小视频免费看| 欧美女孩性生活视频| 在线观看h网| 国产一区二区免费电影| 欧美亚洲一区二区三区| 在线观看免费小视频| 精品视频123区在线观看| 欧美性天天影视| 91在线播放视频| 国产日韩欧美高清免费| 五月天综合视频| 欧美肥胖老妇做爰| 国产天堂在线播放视频| 久草一区二区| 男女男精品视频网| 一区二区视频免费看| 精品国产一区二区三区四区四 | 欧美日韩大陆一区二区| 成人免费在线| 久久66热这里只有精品| 日本vs亚洲vs韩国一区三区| 欧美特黄一级片| 亚洲第一精品电影| 78精品国产综合久久香蕉| 狠狠精品干练久久久无码中文字幕 | 91精品国产综合久久香蕉最新版 | 欧美尺度大的性做爰视频| 精品素人av| 亚洲欧美国产日韩综合| 亚洲一区影音先锋| 国产精品秘入口| av日韩中文字幕| 三级在线观看一区二区| 91狠狠综合久久久| 日韩精品有码在线观看| 99视频有精品高清视频| 啊啊啊一区二区| 亚洲人成精品久久久久| 日本大臀精品| 3d动漫啪啪精品一区二区免费 | 国产九色在线| 99porn视频在线| 日韩影院在线观看| 久久久久香蕉视频| 深夜福利日韩在线看| 日韩精品免费一区二区夜夜嗨 | 日本中文字幕片| 亚洲女同ⅹxx女同tv| 国产区在线视频| 精品国产乱码久久久久软件 | 国产91色在线|亚洲|