精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

用多模態LLM超越YOLOv3!強化學習突破多模態感知極限|開源

人工智能 新聞
華中科技大學、北京郵電大學等多所高校研究團隊共同推出的Perception-R1(PR1),在視覺推理中最基礎的感知層面,探究rule-based RL能給模型感知pattern帶來的增益。

超越YOLOv3、Faster-RCNN,首個在COCO2017 val set上突破30AP的純多模態開源LLM來啦!

華中科技大學、北京郵電大學等多所高校研究團隊共同推出的Perception-R1(PR1),在視覺推理中最基礎的感知層面,探究rule-based RL能給模型感知pattern帶來的增益。

PR1重點關注當下主流的純視覺(計數,通用目標檢測)以及視覺語言(grounding,OCR)任務,實驗結果展現出在模型感知策略上的巨大潛力。

圖片

目前論文和代碼模型均已開源,作者希望其工作能給社區提供一個強大的baseline來支持后續研究。

眼見為實:為何AI視覺感知需要一場革命

隨著OpenAI o3的出現,大模型競賽也正式進入以“視覺推理”為代表的下半場,從GPT-4V到如今的o3,兩年時間,人工智能正在迅速改變人與世界互動的方式,而這場革命在很大程度上依賴于AI理解視覺信息的能力。

從自動駕駛汽車在復雜的街道上導航,到醫療AI從掃描圖像中診斷疾病,甚至是整理照片庫的應用程序,視覺感知都是基礎。

多模態大語言模型(MLLM),如OpenAI的GPT-4o、Google的Gemini,以及開源的Qwen-VL和LLaVA,代表了巨大的進步。這些模型將語言模型(LLM)的語言理解能力與處理圖像的能力相結合,使我們能夠與AI“交談”關于圖片的內容。詢問它們圖片中有什么,它們通常能告訴你。

然而,在識別物體和真正以細致入微的理解和邏輯感知視覺世界之間存在微妙的差異。雖然MLLM在一般的視覺問答方面越來越出色,但它們在需要精確物體定位、準確計數多個物體、在復雜布局中完美閱讀文本或執行復雜視覺推理的任務上常常表現不佳。這就像知道圖片中有一只貓和能夠精確指出它的耳朵、計算它的胡須或理解它與其他物體的互動之間的區別。

強化學習的崛起與Perception-R1的誕生

強化學習(Reinforcement Learning, RL)引發了語言模型的范式轉變。像RLHF(來自人類反饋的強化學習)和基于規則的RL等技術,在DeepSeek-R1中被用來解鎖 emergent reasoning 能力,推動LLM向更強的推理能力發展。

這引出了一個問題:強化學習能否為MLLM的視覺感知能力帶來類似的革命?

早期的嘗試顯示出希望,但并非通用的成功。簡單地將語言領域的RL技術應用于視覺任務并不總能產生預期的收益。這暗示視覺感知可能遵循與純語言不同的規則。

Perception-R1 應運而生。由華科,北郵以及JHU等高校的研究人員聯合開發的開創性框架,如論文中所描述的那樣這種方法回歸到基本原理,探索如何有效地將基于規則的強化學習定制到MLLM視覺感知的獨特挑戰中。這不僅僅是讓MLLM看起來更好,而是通過學習最佳的“感知策略”(Perception Policy)來教導它們更智能地看。

Perception-R1框架:工作原理

Perception-R1 不是從頭開始構建一個新的MLLM,而是一個后訓練框架,旨在通過基于規則的強化學習顯著增強現有 capable MLLM(如Qwen2-VLInstruct-2B)的視覺感知能力。

什么是“感知策略”?

“感知策略”可以視為MLLM處理視覺任務的內部策略,具體包括以下步驟:

  1. 從圖像中提取和理解相關的視覺細節。
  2. 基于這種視覺理解執行邏輯操作(例如,比較位置、識別實例、識別文本)。
  3. 以正確的格式生成所需的輸出(例如,邊界框坐標、計數、轉錄文本)。

Perception-R1 使用一種名為 Group Relative Policy Optimization(GRPO) 的強化學習技術來優化這一策略。GRPO 曾在DeepSeek-R1中取得成功,其工作原理如下(簡版):

圖片

GRPO原理公式:

  1. Rollout(多次嘗試):要求模型多次生成輸出(例如,8次)。由于生成中的隨機性(由溫度參數控制),每次輸出可能略有不同。
  2. 獎勵建模:根據明確的評分標準(獎勵函數)評估每次嘗試。例如,對于邊界框任務,使用Intersection over Union(IoU)衡量模型輸出與正確答案的重疊程度。
  3. 相對比較:GRPO 通過比較多次嘗試的獎勵分數,計算平均值。優于平均水平的嘗試獲得正“優勢”,低于平均水平的獲得負“優勢”。
  4. 策略更新:利用這些相對優勢更新模型的策略,增加生成高獎勵輸出的概率,減少低獎勵輸出的概率。
  5. 重復優化:在大量示例上重復此過程,逐步優化感知策略。

具體框架如下:

圖片

△Perception-R1 架構示意圖

做好視覺任務的關鍵:獎勵工程(Reward Modeling)

在強化學習中,獎勵函數至關重要,它是指導學習過程的核心信號。視覺感知任務通常具有直接、可量化的 ground truth,Perception-R1 利用這一點設計了基于規則的獎勵函數,總獎勵由兩部分組成:

  1. 格式獎勵:檢查輸出是否符合預期結構。例如,邊界框任務要求輸出
    圖片格式,正確則得+1分,錯誤則扣-1分。
  2. 答案獎勵:衡量感知的正確性,使用任務特定的指標:
  • 視覺定位(RefCOCO):預測邊界框與 ground truth 的 IoU。
  • 視覺計數(PixMo-Count):將任務重新定義為點檢測后計數,獎勵基于預測點與ground truth點的歐幾里得距離。
  • 光學字符識別(OCR - PageOCR):預測文本與 ground truth 的編輯距離(Levenshtein distance)。

多主體獎勵匹配的挑戰與解決方案

對于涉及多個實例的任務(如物體檢測和計數),如何匹配預測結果與 ground truth 是一個難題。Perception-R1 采用二分圖匹配解決:

  • 將預測結果和 ground truth 視為兩組點。
  • 計算每對之間的潛在獎勵(例如,IoU)。
  • 使用匈牙利算法找到總獎勵最大的最優匹配。

圖片

這確保了獎勵計算基于最佳對應關系,為多物體感知任務提供了更準確的學習信號。最終總獎勵為:

圖片

實驗結果:Perception-R1的突破性表現

Perception-R1 的實際表現如何?研究人員在一套標準視覺感知基準上對其進行了評估,并將其與強大的基準 MLLM(如原始 Qwen2-VL-2B-Instruct)進行了比較,甚至與只為特定任務設計的專門 “專家 “模型進行了比較。

visual grounding任務(RefCOCO/+/g)

圖片


△visual grounding評測

OCR任務(PageOCR)

圖片

△PageOCR評測

視覺計數任務(Pixmo-Count)以及目標檢測任務(COCO2017)

圖片

△視覺計數和目標檢測評測

通用圖像理解(general image understanding)

圖片

△image understanding and reasoning 評測

重要消融實驗

Perception-R1也進行了全面的消融實驗來探究現階段rule-based RL對perception policy learning的有效性會受到哪些方面影響,研究人員詳細評測了reward matching,是否使用顯式的thinking以及SFT與RL優劣的問題都進行了深刻的探討,接著Perception-R1也展示其良好的可擴展特性,為后續大規模scale up提供了實驗驗證。

圖片

△Perception-R1的可擴展性實驗

結論:邁向更加智能的AI視覺感知

Perception-R1 表明,當強化學習被精心適配到視覺任務的獨特特性時,它可以成為教導大模型更準確、更邏輯地“看”的強大工具。通過優化感知策略,該框架推動了MLLM在物體檢測、計數和OCR等任務上的能力邊界。

盡管真正的視覺“頓悟”仍需探索,Perception-R1奠定了關鍵基礎。它挑戰了視覺任務必須依賴語言推理的假設,并強調了任務復雜性對RL效果的重要性。

隨著模型規模擴大和更具挑戰性的基準出現,Perception-R1的原則可能在構建下一代智能感知AI系統中發揮關鍵作用。

論文鏈接:https://arxiv.org/pdf/2504.07954

代碼鏈接:https://github.com/linkangheng/PR1

博客鏈接:https://medium.com/@jenray1986/perception-r1-reinventing-ai-vision-with-reinforcement-learning-253bf3e77657

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-01-08 08:21:16

2024-12-18 18:57:58

2023-05-28 23:26:16

多模態機器學習大腦

2025-03-19 09:30:00

2024-06-04 14:11:00

2024-08-08 13:04:28

2024-12-12 00:25:09

2024-05-21 07:54:30

視頻多模態語義檢索算法

2024-09-13 06:32:25

2025-05-09 08:40:00

2024-01-11 16:24:12

人工智能RAG

2025-08-18 08:30:00

AI模型開源

2024-12-17 12:08:21

IAA多模態LLM

2024-12-26 01:20:53

多模態大模型圖片

2025-05-28 03:30:00

AI人工智能大數據

2020-09-29 17:00:33

人工智能

2024-04-08 00:12:19

2024-08-12 07:30:00

模型訓練

2024-11-13 09:39:13

點贊
收藏

51CTO技術棧公眾號

精品亚洲免a| 久久国内精品一国内精品| 精品中文字幕在线| 777精品久无码人妻蜜桃| 殴美一级黄色片| 91www在线| 91成人精品| 日本国产一区二区| 国内外成人免费视频| 久久高清内射无套| 国产精品videossex撒尿| 9人人澡人人爽人人精品| 俺去亚洲欧洲欧美日韩| 天天干在线影院| 蜜桃视频在线观看网站| 亚洲国产裸拍裸体视频在线观看乱了中文 | 欧美国产精品中文字幕| 精品久久久久久亚洲综合网| 永久免费精品视频网站| 成人h动漫精品一区二区下载| 成功精品影院| 伊人色综合久久天天| 国产精品网址在线| 亚洲女优在线观看| 亚洲黄色网址| 97久久超碰国产精品| 欧美激情视频网址| 91精品国产高清91久久久久久 | 国产经典一区| 亚洲va欧美va人人爽午夜| 国产精品视频yy9099| 三级网站在线免费观看| 日韩深夜视频| 91女人视频在线观看| 久久男人av资源网站| 69亚洲乱人伦| 96av在线| 亚洲免费高清视频在线| 亚洲一区久久久| 中文字幕av免费在线观看| 国产精品久久久久久av公交车| 国产精品久久国产精麻豆99网站| 国产精品一区二区三| 天海翼一区二区| 亚洲免费福利一区| 欧美专区亚洲专区| 中文字幕免费高| www日本视频| 亚洲三级观看| 欧美日韩国产成人高清视频| 免费成人深夜蜜桃视频| 国产综合久久久| 欧美日本韩国一区| 国产精品免费看久久久无码| 少妇精品高潮欲妇又嫩中文字幕| 亚洲一级在线| 最近2019中文免费高清视频观看www99| 在线观看免费污视频| 午夜在线激情影院| 26uuu色噜噜精品一区二区| 国产精品区一区二区三在线播放| 800av免费在线观看| 欧美日韩在线网站| 精品国产一区二区三区不卡| 黄色一级一级片| 欧美人xxx| 成人白浆超碰人人人人| 国产精品欧美日韩久久| 在线免费观看国产精品| 日日摸夜夜添夜夜添国产精品| 久久久国产在线视频| 日本黄色免费片| 精品精品国产毛片在线看| 精品国产乱码久久久久久图片| 亚洲av午夜精品一区二区三区| 精品中文字幕一区二区三区四区| 精品国产成人av| 亚洲一区二区在| 色婷婷av一区二区三区之e本道| 丁香网亚洲国际| 国产精品色悠悠| 一级片视频免费| 国产精品日韩欧美一区| 欧美亚洲免费电影| 加勒比婷婷色综合久久| 免费观看不卡av| 欧美大片国产精品| 中文字幕av专区| 国产精品2区| 亚洲精品一线二线三线| 美女又爽又黄免费| 日本亚州欧洲精品不卡| 欧美色图一区二区三区| 人妻少妇被粗大爽9797pw| 国产调教视频在线观看| 国产女主播视频一区二区| 国产日韩久久| аⅴ资源新版在线天堂| 91麻豆产精品久久久久久| 午夜精品一区二区三区在线观看| 爽爽视频在线观看| 丁香婷婷深情五月亚洲| 免费日韩av电影| 日本美女一级视频| 国产成人精品一区二区三区四区| 国产精品久久久久久久一区探花| 国产农村老头老太视频| 久久se这里有精品| 国产精品2018| 日本黄色一级视频| 国产一区二区三区免费看| 国产日韩精品综合网站| 中文字幕精品在线观看| 丝袜美腿成人在线| 日产精品99久久久久久| 人人爽人人爽人人片av| 久久精选视频| 日韩av免费在线看| 国产国语亲子伦亲子| 国产精品一区二区免费不卡| 99超碰麻豆| 亚洲av无码专区在线| 国产大片一区二区| 日韩一区免费观看| a√资源在线| 欧美激情一区在线观看| 成人av在线不卡| 久草在线新免费首页资源站| 一区二区三区四区国产精品| 九色porny91| 日韩成人在线一区| 欧美精品乱码久久久久久 | a天堂资源在线| 日韩一区二区视频| 丰满人妻一区二区三区大胸 | 美女爆乳18禁www久久久久久| 国模精品一区| 91精品国产色综合| 樱花视频在线免费观看| 美女网站视频久久| 亚洲一区二区三区777| 国产最新视频在线| 1024成人网| 黄色三级中文字幕| av成人在线网站| 精品处破学生在线二十三| 四虎影视一区二区| 日本女人一区二区三区| 成人精品一区二区三区电影黑人| av免费观看网址| 国产精品网站导航| 国产一级不卡毛片| 国产成人精品三级高清久久91| 91黑丝高跟在线| 日日夜夜精品免费| 亚洲日本电影在线| jizzjizz国产精品喷水| 精品按摩偷拍| 欧美一区深夜视频| 日本a一级在线免费播放| 国产精品久久久久aaaa| 91亚洲免费视频| 99热国内精品| 欧美亚洲激情在线| 蜜桃视频在线观看视频| 欧美视频一区二区三区| 麻豆精品国产传媒| 国产精品地址| 国产精品久久久久久久久久久久久久 | 一区二区在线视频观看| 亚洲精品永久免费| 欧美另类videoxo高潮| 久久国产精品露脸对白| 久久最新免费视频| 欧美电影免费观看| 欧美大片在线观看| 国产情侣在线视频| 国产偷国产偷精品高清尤物| 日韩精品一区二区三区四| 亚洲视频国产| 奇门遁甲1982国语版免费观看高清 | 亚洲AV第二区国产精品| 中文字幕一区免费在线观看| 99九九99九九九99九他书对| 西瓜成人精品人成网站| 色综合久久久久久中文网| 黄色aaa毛片| 亚洲欧美区自拍先锋| 久久国产免费视频| 久久激情视频| 综合网五月天| 国产一区福利| 九九精品在线观看| 色窝窝无码一区二区三区| 色天天综合色天天久久| 91视频青青草| 91麻豆.com| 在线能看的av网站| 欧洲杯半决赛直播| 亚洲综合色av| 欧美片第1页| 免费av一区二区| 国产一区二区在线视频观看| 亚洲高清免费观看高清完整版在线观看| 亚洲欧美日本一区二区| 亚洲精品欧洲| 伊人久久大香线蕉成人综合网| av成人综合| 国产精选久久久久久| 爱情岛论坛亚洲品质自拍视频网站| 欧美一级精品在线| 欧美a视频在线观看| 亚洲免费观看高清完整| 欧美丰满老妇熟乱xxxxyyy| 成人午夜视频网站| 亚洲va在线va天堂va偷拍| 国产情侣一区| 欧美美女黄色网| 136导航精品福利| 日本精品久久久| 欧美性猛片xxxxx免费中国| 亚洲欧美在线磁力| 男人天堂2024| 亚洲午夜精品在线| 国产精品无码一区二区三| 精品亚洲porn| 国产资源第一页| 成人精品天堂一区二区三区| 国产欧美日韩综合精品| 小草在线视频免费播放| 久久久久久久91| 外国精品视频在线观看| 欧美日韩一区二区三区视频| 久久亚洲精品国产| 亚洲国产欧美在线人成| 久久久久久视频| 国产精品婷婷午夜在线观看| 亚洲色成人网站www永久四虎| aaa国产一区| 老熟妇精品一区二区三区| 成人免费视频网站在线观看| 中文字幕第10页| 亚洲欧美日韩视频二区| 日韩国产精品一区二区| 欧美绝顶高潮抽搐喷水合集| 国产精品久久久久久久app| 黑人巨大亚洲一区二区久| 中文字幕久热精品在线视频| 国产美女自慰在线观看| 欧美日韩在线电影| 中文字幕一区二区三区四区视频 | 头脑特工队2免费完整版在线观看 头脑特工队2在线播放 | 日韩av在线一区| 久久夜色精品国产噜噜亚洲av| 亚洲国产wwwccc36天堂| 麻豆一区二区三区精品视频| 久久综合色鬼综合色| 日韩av片网站| 国内精品久久久久久久影视蜜臀| 免费观看中文字幕| 99欧美视频| 欧洲金发美女大战黑人| 欧美a级片网站| 免费精品视频一区| 亚洲最好看的视频| 日本不卡一区二区三区视频| 欧美专区视频| 国产精品久久久久av福利动漫| 97久久精品| 精品免费日产一区一区三区免费| 天天综合在线观看| 91欧美日韩一区| 亚洲精品.com| 久久理论片午夜琪琪电影网| 17videosex性欧美| 欧美一区亚洲一区| 成人免费黄色| 奇米四色中文综合久久| 91九色综合| 亚洲最大福利视频| av成人在线播放| 亚洲一区二区三区777| 国偷自产av一区二区三区| 久久涩涩网站| silk一区二区三区精品视频| 国产日韩精品推荐| 精品免费在线| 法国空姐在线观看免费| 一本色道精品久久一区二区三区| 国产日产欧美一区二区| 一区免费视频| 97久久国产亚洲精品超碰热| 亚洲欧洲午夜| 黄大色黄女片18第一次| 国产成人av电影在线| 熟妇无码乱子成人精品| 不卡的av在线播放| 亚洲AV无码成人精品区明星换面| 亚洲精品网站在线观看| 日韩手机在线视频| 日韩视频免费观看高清完整版在线观看 | 在线观看完整版免费| 九九九久久久久久| 成人黄色图片网站| 国产精品区一区二区三含羞草| 色诱亚洲精品久久久久久| 中文字幕在线播放一区二区| 99精品视频在线播放观看| 国产成人免费观看网站| 久久久综合视频| 91嫩草丨国产丨精品| 欧美午夜性色大片在线观看| 日韩男人的天堂| 欧美三区在线观看| 色欲久久久天天天综合网| 美日韩丰满少妇在线观看| 欧美最新精品| 国内精品二区| 欧美黄免费看| 色播五月激情五月| 久久久久久一二三区| 国产一区二区三区四区五区六区| 一区二区三区四区在线播放| 中文字幕人妻色偷偷久久| 日韩电视剧在线观看免费网站| 91一区二区三区在线| 欧美高跟鞋交xxxxhd| 黄色日韩网站| 91久久久久久久久久久久久| 精品久久成人| 欧美日韩在线不卡视频| 成人午夜激情影院| 日韩三级在线观看视频| 欧美性猛交xxxx乱大交退制版| 青青免费在线视频| 午夜精品免费视频| 欧美日韩大片| 精品乱码一区| 99国产精品私拍| 国产人妻黑人一区二区三区| 91免费国产在线观看| 国产一级av毛片| 日韩欧美久久久| 成人黄色网址| 性日韩欧美在线视频| 亚洲视频国产| 欧洲精品在线播放| 国产不卡视频一区二区三区| 九九热最新地址| 欧美一区二区成人6969| 色鬼7777久久| 欧美与欧洲交xxxx免费观看| 久久精品论坛| 国产综合免费视频| 国产午夜亚洲精品午夜鲁丝片| 日本韩国欧美中文字幕| 欧美精品亚洲二区| 午夜视频在线免费观看| 国内成人精品视频| 欧美激情极品| 日韩精品一区二区三区不卡 | 欧美亚洲综合一区| 国模吧精品人体gogo| 国产精品欧美在线| 天天综合国产| 国产男女无遮挡猛进猛出| 亚洲综合久久av| 波多野结衣一二区| 中文字幕v亚洲ⅴv天堂| 深夜福利亚洲| 91精品国产毛片武则天| 成人h动漫精品| 无码人妻一区二区三区线| 中文字幕欧美亚洲| 精品久久免费| 僵尸世界大战2 在线播放| 久久 天天综合| 青娱乐国产精品| 欧美日韩国产电影| 少女频道在线观看高清 | 一区二区三区国产精品| 色wwwwww| 91精品久久久久久久久青青| 韩日欧美一区| xxxxx在线观看| 91精品国产全国免费观看| 高清精品在线| 91视频免费进入| 亚洲欧美日韩在线观看a三区| 手机看片日韩av| 日韩精品中文字幕一区| 成人私拍视频| 中文字幕乱码免费| 久久综合狠狠综合久久综合88| 夜夜爽8888| 色偷偷亚洲男人天堂| 91成人福利| 国产精品久久a| 亚洲成av人片在线观看无码| av大全在线免费看|