精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

GRPO強(qiáng)化多模態(tài)大模型目標(biāo)檢測(cè)能力獎(jiǎng)勵(lì)函數(shù)代碼設(shè)計(jì) 原創(chuàng)

發(fā)布于 2025-7-14 07:20
瀏覽
0收藏

多模態(tài)大模型的目標(biāo)檢測(cè)任務(wù)可以通過GRPO訓(xùn)練增強(qiáng),因此今天本文介紹的代碼適用于需要預(yù)測(cè)邊界框的多模態(tài)任務(wù),代碼將圍繞"邊界框預(yù)測(cè)任務(wù)"構(gòu)建一套獎(jiǎng)勵(lì)機(jī)制,用于評(píng)估模型輸出的質(zhì)量,獎(jiǎng)勵(lì)以下維度:

  • 基于 IoU 計(jì)算獎(jiǎng)勵(lì)
  • 基于置信度計(jì)算獎(jiǎng)勵(lì)
  • 答案格式獎(jiǎng)勵(lì)

工具函數(shù)(邊界框處理函數(shù))

  • ??extract_bbox(response)???:從模型輸出文本中提取邊界框信息。模型輸出需用??</think>???和??<|FunctionCallEnd|>???包裹邊界框數(shù)據(jù)(如??[{"Position": [x1,y1,x2,y2], "Confidence": 0.9}, ...]???)。處理格式錯(cuò)誤(如單引號(hào)轉(zhuǎn)雙引號(hào)、補(bǔ)全截?cái)嗟腏SON結(jié)構(gòu)),返回解析后的邊界框列表或??None??(解析失敗)。GRPO強(qiáng)化多模態(tài)大模型目標(biāo)檢測(cè)能力獎(jiǎng)勵(lì)函數(shù)代碼設(shè)計(jì)-AI.x社區(qū)
  • ??calculate_iou(bbox1, bbox2)???:計(jì)算兩個(gè)邊界框的交并比(IoU),衡量重疊程度。輸入:兩個(gè)邊界框的坐標(biāo)??(x1,y1,x2,y2)??(左上角和右下角)。輸出:IoU值(0~1,值越高重疊越好)。GRPO強(qiáng)化多模態(tài)大模型目標(biāo)檢測(cè)能力獎(jiǎng)勵(lì)函數(shù)代碼設(shè)計(jì)-AI.x社區(qū)
  • ??sort_and_calculate_iou(list1, list2, iou_threshold=0.5)??:將預(yù)測(cè)邊界框與真實(shí)邊界框匹配,計(jì)算IoU結(jié)果。GRPO強(qiáng)化多模態(tài)大模型目標(biāo)檢測(cè)能力獎(jiǎng)勵(lì)函數(shù)代碼設(shè)計(jì)-AI.x社區(qū)

步驟:

    輸出:列表??[(iou1, confidence1), (iou2, confidence2), ...]??,記錄每個(gè)預(yù)測(cè)框的匹配質(zhì)量。

  1. 預(yù)測(cè)框按置信度降序排序。
  2. 對(duì)每個(gè)預(yù)測(cè)框,匹配真實(shí)框中未匹配過的、IoU最大的框(超過閾值視為匹配)。
  • ??remove_duplicates(bbox_list)??:移除重復(fù)的邊界框(通過坐標(biāo)去重),確保每個(gè)邊界框唯一。GRPO強(qiáng)化多模態(tài)大模型目標(biāo)檢測(cè)能力獎(jiǎng)勵(lì)函數(shù)代碼設(shè)計(jì)-AI.x社區(qū)

獎(jiǎng)勵(lì)計(jì)算邏輯

  • ??compute_reward_iou??:IoU(衡量位置準(zhǔn)確性),匹配成功(IoU>0)時(shí),置信度越高獎(jiǎng)勵(lì)越高;匹配失敗(IoU=0)時(shí),高置信度會(huì)被懲罰(獎(jiǎng)勵(lì)降低)。GRPO強(qiáng)化多模態(tài)大模型目標(biāo)檢測(cè)能力獎(jiǎng)勵(lì)函數(shù)代碼設(shè)計(jì)-AI.x社區(qū)
  • ??compute_reward_confidence??:衡量模型對(duì)預(yù)測(cè)的確定性。GRPO強(qiáng)化多模態(tài)大模型目標(biāo)檢測(cè)能力獎(jiǎng)勵(lì)函數(shù)代碼設(shè)計(jì)-AI.x社區(qū)

獎(jiǎng)勵(lì)函數(shù)設(shè)計(jì)

  • ??accuracy_reward_iou???:基于邊界框IoU的準(zhǔn)確性獎(jiǎng)勵(lì)。輸入:模型預(yù)測(cè)(??completions???)和標(biāo)準(zhǔn)答案(??solution???)。1. 提取預(yù)測(cè)和真實(shí)的邊界框,去重后計(jì)算IoU匹配結(jié)果。2. 用??compute_reward_iou??計(jì)算獎(jiǎng)勵(lì)(0~1,值越高預(yù)測(cè)越準(zhǔn))。GRPO強(qiáng)化多模態(tài)大模型目標(biāo)檢測(cè)能力獎(jiǎng)勵(lì)函數(shù)代碼設(shè)計(jì)-AI.x社區(qū)
  • ??accuracy_reward_confidence???:基于預(yù)測(cè)置信度的準(zhǔn)確性獎(jiǎng)勵(lì)。邏輯與??accuracy_reward_iou??類似,但獎(jiǎng)勵(lì)更側(cè)重預(yù)測(cè)框的置信度合理性(例如:匹配成功時(shí)高置信度加分,匹配失敗時(shí)高置信度扣分)。GRPO強(qiáng)化多模態(tài)大模型目標(biāo)檢測(cè)能力獎(jiǎng)勵(lì)函數(shù)代碼設(shè)計(jì)-AI.x社區(qū)
  • ??format_reward??:與DeepSeek-R1那樣對(duì)模型輸出格式進(jìn)行獎(jiǎng)勵(lì)。這里不多介紹。

GRPO強(qiáng)化多模態(tài)大模型目標(biāo)檢測(cè)能力獎(jiǎng)勵(lì)函數(shù)代碼設(shè)計(jì)-AI.x社區(qū)


本文轉(zhuǎn)載自??大模型自然語(yǔ)言處理??   作者:余俊暉

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請(qǐng)注明出處,否則將追究法律責(zé)任
已于2025-7-14 10:46:14修改
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
欧美成人一区二区三区片免费| 国产91丝袜在线播放九色| 日韩精品中文字幕视频在线| 亚洲爆乳无码专区| 91官网在线| 国产精品资源站在线| 午夜欧美不卡精品aaaaa| 蜜桃无码一区二区三区| 国产美女视频一区二区 | 精品裸体舞一区二区三区| 日本www在线播放| 人人干在线视频| av不卡在线观看| 国产精品一区久久| 国产乡下妇女做爰视频| 日韩国产综合| 精品久久久久久久人人人人传媒 | 蜜桃导航-精品导航| 国产精品久久欧美久久一区| 亚洲免费影院| 欧美福利小视频| 欧美成人另类视频| 精品国产导航| 日韩欧美国产综合一区 | 好吊色视频在线观看| 亚洲裸色大胆大尺寸艺术写真| 3d动漫精品啪啪1区2区免费| 国产精品-区区久久久狼| 菠萝菠萝蜜在线视频免费观看| 久久日韩粉嫩一区二区三区| 精品久久久久久久大神国产| 亚洲一区二区欧美日韩| 欧美激情一区二区三区在线视频| 国产特黄一级片| 日韩国产欧美在线视频| 久久久噜噜噜久久| 91免费公开视频| 成人综合专区| 精品亚洲精品福利线在观看| 亚洲国产欧美日韩在线| 成人av集中营| 色婷婷一区二区| 啊啊啊一区二区| 97人澡人人添人人爽欧美| 亚洲丝袜精品丝袜在线| 伊人久久99| 日本a在线播放| 国产精品久久久久一区| 日韩欧美第二区在线观看| 亚洲AV第二区国产精品| 成人免费毛片片v| 成人av片网址| 亚洲第一天堂影院| 国产成人精品一区二| 亚洲iv一区二区三区| 国产免费高清视频| 国产一区二区在线观看免费| 91在线免费看网站| 精品久久久久久亚洲综合网站| 久久精品国产77777蜜臀| 国产日韩欧美中文| 国产在成人精品线拍偷自揄拍| 蜜桃一区二区三区四区| 成人av在线天堂| 国产麻豆免费观看| 国产精品99久久不卡二区| 99精品国产一区二区| 精品黑人一区二区三区在线观看 | 97精品国产97久久久久久| 日韩乱码一区二区| 一区二区91| 国产成人精品免费久久久久| 一级久久久久久| 蜜桃av一区二区三区| 成人在线国产精品| 国产成人三级一区二区在线观看一| 日韩高清电影一区| 国产中文字幕亚洲| 亚洲精品一级片| 97精品电影院| 亚洲人体一区| 性欧美video高清bbw| 亚洲1区2区3区4区| 欧美极品欧美精品欧美图片| 成人日韩av| 日韩欧美亚洲另类制服综合在线| 日韩精品视频一区二区| 精品国产一区二区三区香蕉沈先生| 中日韩午夜理伦电影免费 | 中文在线观看免费视频| 香蕉久久夜色精品国产使用方法 | 欧美一区二区三区人| 怡红院一区二区| 欧美中文字幕一区二区| 欧美日韩高清在线观看| 国产suv精品一区二区33| 美日韩一级片在线观看| 成人在线观看91| 国产午夜精品一区理论片| 亚洲码国产岛国毛片在线| 国产原创中文在线观看| 国产香蕉久久| 日韩高清a**址| 午夜激情福利网| 天天干天天干天天干| 天天爱天天干天天操| 91视频一区二区三区| 一区二区三区观看| 超碰在线网站| 欧美日韩不卡在线| yy6080午夜| 亚洲精品网址| 国产成人一区二区三区小说| 亚洲精品国产suv一区| 中文字幕精品综合| 国产乱子伦农村叉叉叉| 精品一区91| 一本久久综合亚洲鲁鲁| 国产污视频在线观看| 国产自产v一区二区三区c| 欧美日韩高清在线一区| 草草影院在线| 91精品婷婷国产综合久久性色| 91久久免费视频| 亚洲国产精品第一区二区三区| 国产久一一精品| 黄色在线视频观看网站| 亚洲1区2区3区视频| 色婷婷狠狠18禁久久| 婷婷综合视频| 国产欧美一区二区三区视频| 国产区视频在线播放| 精品国产乱码久久久久久天美| 337p日本欧洲亚洲大胆张筱雨| 天天揉久久久久亚洲精品| 国产精品羞羞答答| 可以在线观看的av| 欧美日韩在线免费| 国产十八熟妇av成人一区| 国产一区二区三区四区三区四| 91视频国产高清| 久久精品视频观看| 欧美日韩国产精品自在自线| 国产成人一区二区在线观看| 久久一区亚洲| 日本一区二区精品视频| 自拍偷自拍亚洲精品被多人伦好爽| 日韩av在线免费| 天天操天天摸天天干| av高清不卡在线| 国产亚洲综合视频| 你微笑时很美电视剧整集高清不卡| 午夜剧场成人观在线视频免费观看| 国 产 黄 色 大 片| 亚洲一区二区三区国产| 国产精品成人99一区无码 | 一级爱爱免费视频| 国产精品水嫩水嫩| 在线观看国产中文字幕| 天堂美国久久| www.成人av| 国产免费拔擦拔擦8x在线播放| 亚洲精品ady| 老熟妇仑乱一区二区av| 国产香蕉久久精品综合网| 九一精品在线观看| 国产精品久久观看| 国产aⅴ精品一区二区三区黄| 欧美巨大xxxx做受沙滩| 亚洲国产一区二区三区四区| 五月婷婷色丁香| 日本一区二区成人在线| 黄色片免费网址| 激情综合久久| 欧美一区二区在线| 久久精品 人人爱| 粗暴蹂躏中文一区二区三区| 亚洲精品一区二区口爆| 日韩欧美国产高清91| 人成免费在线视频| 国产成人免费视| 能在线观看的av| 国产精品99久久久久久动医院| 国产91精品入口17c| 国模冰冰炮一区二区| www.欧美精品| 污污视频在线免费看| 欧美影视一区在线| 国产精品一区二区6| 91丨国产丨九色丨pron| 性chinese极品按摩| 亚洲综合中文| 精品国产一区二区三区麻豆小说| 97成人资源| 麻豆成人在线看| 日韩专区一区二区| 欧美日韩电影在线播放| 日韩 欧美 精品| 国产精品久久三| 国产不卡一二三| 久久er精品视频| 欧美日韩国产精品激情在线播放| 欧美激情成人| 久久伊人资源站| 欧美精品三级在线| 国产精品va在线播放| 污污视频在线| 在线看欧美日韩| 天天综合网天天综合| 91.com视频| 人人妻人人爽人人澡人人精品| 一区二区三区不卡视频| 超碰人人人人人人人| 99精品国产热久久91蜜凸| 五月天婷婷亚洲| 美女诱惑一区| 国产自产在线视频| 91精品电影| 亚洲v国产v在线观看| 欧美日韩一区二区三区四区不卡| 亚洲最大福利视频网| 欧美黑粗硬大| 国产精品美女av| 成人勉费视频| 91av视频在线观看| 成人免费一区二区三区牛牛| 成人97在线观看视频| 日韩免费网站| 中文字幕免费精品一区| 黄视频在线观看免费| 日韩乱码在线视频| 天堂在线观看视频| 欧美xxxx在线观看| 国产成a人亚洲精v品无码| 精品视频在线免费看| 国产99久久久久久免费看| 日韩欧美在线视频观看| 欧美亚韩一区二区三区| 亚洲v日本v欧美v久久精品| 亚洲色图综合区| 亚洲免费在线视频| 自拍偷拍第9页| 中文字幕一区二区三区不卡在线 | 中文在线综合| 超碰97在线播放| 中文字幕一区二区三区四区久久 | 国产精品情侣自拍| 日韩毛片一区| 国产精品视频男人的天堂| 电影一区电影二区| 国产美女搞久久| 四虎国产精品永久在线国在线| 国产日韩在线视频| 视频欧美精品| 亚洲最大av网站| 97se亚洲| 久久久久一区二区| 怕怕欧美视频免费大全| 五月天久久狠狠| 91精品1区| 精品成在人线av无码免费看| 日韩午夜激情| 国产熟女高潮视频| 免费在线观看日韩欧美| 一个色综合久久| 国产精品亚洲第一区在线暖暖韩国| 国产伦理在线观看| 97久久精品人人做人人爽50路| 国产福利短视频| 国产三区在线成人av| 制服丨自拍丨欧美丨动漫丨| 亚洲蜜桃精久久久久久久| 精品无码m3u8在线观看| 欧美日韩日本国产| 中国老头性行为xxxx| 欧美精选一区二区| 高清一区二区三区四区| 亚洲人成啪啪网站| 免费黄色网页在线观看| 久久久久久尹人网香蕉| 精品3atv在线视频| 91老司机精品视频| 国产成人精品福利| 日韩高清国产精品| 欧美~级网站不卡| 国产女大学生av| 麻豆一区二区在线| 一级黄色免费视频| 中文字幕欧美激情一区| 久久免费小视频| 在线免费av一区| 亚洲精品综合网| 在线视频中文亚洲| 1区2区在线| 91免费版网站入口| 亚洲毛片免费看| 久久av高潮av| 日韩成人精品在线| 天天躁日日躁狠狠躁免费麻豆| 日本一区二区三级电影在线观看 | 欧美日韩激情在线| 蜜桃91麻豆精品一二三区| 国产亚洲一区二区精品| 污网站在线免费看| 日本亚洲精品在线观看| 香蕉大人久久国产成人av| 日韩免费毛片| 国产午夜久久| 能看毛片的网站| 欧美精彩视频一区二区三区| 日韩久久精品视频| 日韩欧美区一区二| 五月天婷婷在线视频| 91精品国产高清| 国产精品欧美一区二区三区不卡 | 国产在线久久久| 亚洲天堂日韩在线| 国产精品无码人妻一区二区在线 | 91av在线免费| 亚洲精品高清在线| 一本色道久久综合精品婷婷| 国产亚洲精品久久| 末成年女av片一区二区下载| 91蜜桃网站免费观看| 国产精品7m凸凹视频分类| 波多野结衣天堂| 久久亚洲捆绑美女| 日韩激情在线播放| 亚洲第一区第一页| 欧美xxxx黑人又粗又长| 亚洲综合在线小说| 国产精品99在线观看| 日韩不卡一二三| 日本一区二区三区国色天香| 一级特黄免费视频| 亚洲美女中文字幕| 亚洲天堂av影院| 久久精品欧美| 亚洲一区欧美二区| 亚洲少妇18p| 五月婷婷激情综合| 欧美一区二区三区激情| 久久久久在线观看| 国产亚洲精品美女久久| 全黄性性激高免费视频| 成人国产精品免费| 日本五十熟hd丰满| 日韩av在线直播| 亚洲福利影院| 欧美日韩一区二区视频在线| 老司机精品视频网站| a天堂中文字幕| 欧美日韩一区二区欧美激情| 亚洲视频tv| 亚洲最大的网站| 伊人久久亚洲热| 毛茸茸多毛bbb毛多视频| 欧美性xxxx极品hd满灌| 久久米奇亚洲| 国产精品永久免费观看| 亚洲精品国产首次亮相| 曰本三级日本三级日本三级| 午夜国产精品一区| 男生女生差差差的视频在线观看| 国产成人涩涩涩视频在线观看| 不卡一区综合视频| 在线免费看v片| 亚洲一区二区三区在线看| 天天综合在线视频| 国产91在线播放精品91| 久久精品高清| 韩国三级在线看| 色综合夜色一区| 素人av在线| 国产亚洲福利社区| 亚洲综合日韩| 男人在线观看视频| 精品国精品自拍自在线| 一区二区精品伦理...| 亚洲一区二区高清视频| 国产成人综合网| 久久人妻免费视频| 久久视频国产精品免费视频在线| eeuss鲁片一区二区三区| 青青在线视频免费| 亚洲人午夜精品天堂一二香蕉| 少妇一区二区三区四区| 国产精品网红直播| 欧美视频亚洲视频| 91麻豆精品国产91久久综合| 日韩欧美卡一卡二| 欧美成人精品三级网站| 国产免费xxx| 久久午夜国产精品| 国产av无码专区亚洲a∨毛片| 国产91精品久久久| 1024精品久久久久久久久| 国产麻豆剧传媒精品国产av| 欧美日韩在线一区二区| 极品美鲍一区|