精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

擊敗Meta登榜首:推理增強的文檔排序模型ReasonRank來了

人工智能 新聞
我們在本文提出了多領域面向推理型排序的訓練數據,解決了訓練數據上的難題。

本文的第一作者是劉文涵,就讀于中國人民大學高瓴人工智能學院,博士三年級,導師為竇志成教授,目前在百度大搜部門進行實習。他的研究方向聚焦于 AI 搜索,在頂級國際會議如 ACL、WWW 等發表了多篇論文。

推理大模型(Large Reasoning Model)極大的促進了自然語言處理領域的發展,而信息檢索領域的核心問題之一是文檔排序,如何利用強大的推理大模型通過主動推理來判斷文檔的相關性,進而再對文檔進行排序是一個值得探索的方向。

在本次工作中,我們提出了 ReasonRank,ReasonRank 在包括 BRIGHT、R2MED 在內的多個榜單,擊敗了 UMASS 大學,Waterloo 大學,Meta 在內的多個大學和機構,于 2025 年 8 月 9 日榮登榜單第一名。我們更小尺寸的 ReasonRank-7B 也遠遠超越了其他 32B 大小的推理型排序大模型,同時相比 pointwise 排序器具備明顯的效率優勢。此外,我們的論文還獲得了 Huggingface paper 日榜第一名。

圖 1:8 月 9 日,ReasonRank 在 BRIGHT benchmark 上榮登榜單第一名

  • 論文標題:ReasonRank: Empowering Passage Ranking with Strong Reasoning Ability
  • 論文鏈接:https://arxiv.org/pdf/2508.07050
  • 代碼倉庫:https://github.com/8421BCD/ReasonRank/
  • 開源數據 & 模型:https://huggingface.co/collections/liuwenhan/reasonrank-68941e9e6af7edd3714ee6e2

研究動機:復雜推理型訓練數據的缺乏

近來,test-time reasoning 已經被證明能夠提升文檔排序器的排序效果。其通過在給出最終排序結果前,先顯式進行一系列推理過程(查詢理解,文檔比較等等)。然而,由于推理密集型(reasoning-intensive)排序訓練數據的稀缺,現有推理型排序器均依賴 MSMARCO 這種傳統 web 搜索數據進行訓練。

這些數據主要側重簡單的語義或詞匹配,導致模型在面臨復雜搜索場景(如 StackExchange 復雜查詢、代碼類查詢、數學類查詢等)時泛化能力受限。而使用人工標注構造推理密集型排序訓練數據代價又是非常高的。

方法設計:數據合成 + 兩階段訓練

為破解推理密集型排序訓練數據稀缺的問題,我們提出了基于 DeepSeek-R1 的自動化數據合成框架,生成了 13K 高質量的推理密集型 listwise 排序訓練數據。基于合成的訓練數據,我們進一步設計了一個兩階段的訓練框架包括 Supervised Fine-Tuning (SFT) 和 Reinforcement Learning (RL)。在 RL 階段,不同于以往僅使用排序指標作為獎勵(reward),我們基于 listwise 排序中滑動窗口策略的特性設計了 multi-view ranking reward,其更適合 listwise 排序。

1. 數據合成

傳統模型在復雜排序任務上表現差,主要是由于缺少面向復雜推理搜索場景的訓練數據的缺失。根據已有的 IR benchmarks,我們將復雜搜索查詢分為四大類并收集了對應領域的用戶查詢:

  • 復雜問答型查詢
  • 代碼類查詢
  • 數學類查詢
  • 網頁搜索類查詢

有了查詢,如何挖掘高質量的候選文檔列表以及構造訓練 label 是一個關鍵問題,其直接影響模型訓練的效果。

在本文,我們提出利用強大的 DeepSeek-R1 從海量的 web 頁面和已有的文檔 corpus 挖掘其相關文檔以及不相關文檔(包含難負例)。在這個過程,我們還給 R1 提供了 query 的人工標注的正確答案來提高挖掘的準確性,相比傳統蒸餾,這樣能夠進一步提升 R1 相關性判斷的準確性。

這樣我們便得到了文檔的 pointwise 訓練標簽(相關 / 不相關)。為了訓練最終的 listwise 排序器,我們繼續利用 DeepSeek-R1 對候選文檔進行 listwise 排序,得到 listwise 訓練標簽(包含推理鏈以及最終的 gold ranking list)。

為了提升訓練數據的質量,我們進一步設計了一個自一致性(self-consistency)數據過濾機制。

我們利用得到的 pointwise 標簽對 listwise 標簽中的 gold ranking list 計算排序指標 NDCG@10,小于閾值 α 的數據將被過濾掉(表明教師模型 R1 判斷不一致,相應數據樣本被丟棄),最終我們得到 13K 高質量的多領域訓練數據集。

2. 兩階段訓練

階段一:冷啟動 SFT

在獲得高質量的推理密集型訓練數據后,我們首先采用監督微調對大模型進行 “冷啟動” 訓練,通過 R1 的推理鏈顯式引導模型學習如何對一組文檔進行對比、推理和排序。具體而言,輸入由用戶查詢和對應的候選文檔列表組成,輸出為 listwise label(也即 R1 生成的推理鏈和 gold ranking list)。

階段二:多視角排序 reward 的強化學習

多視角排序 reward

1) 召回視角(Recall@10):

現有方法在強化學習訓練排序任務中,通常只采用單輪的 NDCG@10 作為獎勵信號。然而,我們認為這種單輪獎勵對于多輪滑動窗口的 listwise 排序任務而言是次優的。這是因為滑動窗口策略要求模型在排序時進行多輪、序列化的局部決策:每一步窗口內的前 10 個文檔才會被傳遞給下一個排序窗口,并通過滑動窗口不斷迭代,實現整體排序。此時,單獨優化每一窗口的 NDCG 指標,并不一定能夠帶來全局最優的排序效果。基于上述觀察,我們在強化學習獎勵設計中,額外引入了 Recall@10 指標來確保重要文檔不會在滑動過程中被遺漏,有助于后續窗口獲得更優的排序基礎。

2) 排序相似度視角(RBO):

此外,相較于基于 pointwise 標簽計算 NDCG@10,我們認為 listwise 訓練標簽的 gold ranking list 能夠提供更細粒度的排序信號。因此,我們引入 RBO(Rank-biased Overlap)指標,作為補充排序獎勵,用于衡量當前排序結果與金標準排序的相似性。

我們將 NDCG@10、Recall@10 和 RBO 結合,構建了多視角排序獎勵:

格式 reward

為了保證正確的輸出格式,我們考慮了兩種格式:

(1)輸出格式:保證輸出內容嵌套在 <think> 和 < answer > 標簽中;

(2)答案格式:<answer > 標簽內的排序列表要滿足特定的輸出格式(例如:[4] > [2] > …)。

最終,我們的強化學習 reward 計算如下,我們使用 GRPO 算法進行 RL 優化。

核心實驗 1:多個 benchmarks 上效果實現 SOTA

為充分評估 ReasonRank 在不同推理型搜索任務上的效果,我們選取了兩個推理型 IR benchmark:

  • BRIGHT:包含 12 個推理密集型搜索任務,涉及復雜問答型檢索,代碼類檢索,定理類檢索等等
  • R2MED:包含 8 個面向醫療類的復雜查詢檢索數據集,覆蓋問答參考文獻檢索、臨床證據檢索和臨床病例檢索

從實驗結果可以發現:ReasonRank 顯著優于已有的排序器。ReasonRank(32B)在 BRIGHT 和 R2MED 上分別超越最好的 baselines 4-5 個點;且 ReasonRank(7B)甚至優于所有的 32B 的 baselines。

此外,我們還在傳統 IR benchmark BEIR 上開展了實驗,結果證明了其良好的泛化性。

核心實驗 2:效率優勢

我們還在 BRIGHT 上測試了 ReasonRank 的排序效率,并與推理型 pointwise 排序器 Rank1 比較。在以往,pointwise 排序器被認為是最高效的。然而,推理場景下,我們發現我們的 listwise 排序器 ReasonRank 效率顯著高于 pointwise 排序器 Rank1。這種高效性來自于 Rank1 需要為每個段落生成推理鏈,而 ReasonRank 一次處理 20 個段落,只生成一條推理鏈,大大減少了輸出的 token 數量。

核心實驗 3:消融實驗

我們還開展了詳盡的消融實驗,結果證明了我們構造的多領域數據集相比于單領域(MSMARCO)的效果優勢以及我們兩階段訓練框架和 multi-view ranking reward 設計的合理性。

總結與未來展望

我們在本文提出了多領域面向推理型排序的訓練數據,解決了訓練數據上的難題。并設計了合理的 SFT 和 RL 訓練方法,充分激發了推理型排序器的效果。未來,如何基于大模型的推理能力繼續提升搜索排序器的效果,我們認為仍有多個方向值得探索:

  • 引入非推理型數據:未來可以在訓練過程中融合非推理型數據,使模型能夠靈活適應不同難度的搜索場景,在推理與非推理模式間自如切換,提升排序器的通用性和實用性。
  • 探索基于全排序(full ranking)的推理型重排序方法:已有的工作已經證明 LLM 一次排序全部候選文檔的能力。未來可以結合 LLM 強大的全排序能力,研究基于推理的全局排序方法,替代當前的滑動窗口策略,以提升模型在大規模文檔排序任務中的效率和表現。
  • 嘗試多樣化模型骨干:后續可嘗試以 Llama 3.1、以及推理型 LRM(例如 Qwen3)等更多不同類型的大語言模型作為 ReasonRank 的基礎,進一步驗證方法的通用性和有效性。
責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-01-27 12:03:11

2025-10-15 00:00:00

2023-06-19 19:26:54

模型開源

2020-05-07 10:02:46

編程語言JavaC語言

2011-06-20 17:26:42

斑馬技術條碼打印RFID打印機

2022-08-18 15:13:37

模型參數

2024-08-27 09:35:47

2025-04-11 12:04:58

2023-12-23 23:08:21

語音數據

2025-03-05 16:19:50

2025-03-10 08:00:00

RAG檢索Reranker

2024-02-04 07:20:00

AI模型

2015-09-06 08:55:54

Java自帶排序算法

2024-09-18 10:37:00

強化學習AI模型

2023-06-06 14:09:32

模型開源

2023-08-15 14:05:27

AI模型

2012-07-13 11:08:11

Rovio憤怒的小鳥移動游戲

2022-12-23 10:37:41

JavaScript文檔

2023-09-03 19:43:46

htmxJavaScript網絡

2022-12-26 14:00:10

模型升級
點贊
收藏

51CTO技術棧公眾號

久草在线资源福利站| 少妇高潮久久久久久潘金莲| 97色在线观看| 欧美在线aaa| 国产精品成人69xxx免费视频 | 国产美女娇喘av呻吟久久| 日韩大陆毛片av| 黄色激情在线视频| 国产精品无码久久av| 人人狠狠综合久久亚洲婷婷| 色综合一区二区| 狠狠爱一区二区三区| 精品无码m3u8在线观看| 久久国际精品| 亚洲欧美福利一区二区| 91精品久久久久久久久久另类| 亚洲av成人精品一区二区三区 | 中文无字幕一区二区三区| 欧美亚洲成人xxx| 白嫩情侣偷拍呻吟刺激| 欧美24videosex性欧美| 欧美 日韩 国产一区二区在线视频| 在线日韩av片| 日本一区二区三区视频在线观看| 男人天堂av在线播放| 欧美日韩播放| 欧美三级视频在线观看| 一区二区精品在线| 99国产在线播放| 精品1区2区3区4区| 亚洲精品97久久| 欧美成人黑人猛交| 国产爆初菊在线观看免费视频网站 | www.26天天久久天堂| 中文av字幕一区| 欧美精品亚洲| 在线观看免费观看在线| 91精品蜜臀一区二区三区在线| 日韩亚洲欧美高清| 免费一级特黄特色毛片久久看| 香港一级纯黄大片| 老司机午夜精品视频在线观看| 一区二区三区回区在观看免费视频| 天天视频天天爽| av毛片在线免费| 不卡的电视剧免费网站有什么| 日本国产一区二区三区| www.99re6| 久久精品色综合| 欧美午夜寂寞影院| 伊人久久在线观看| 性xxxx视频播放免费| 成人a免费在线看| 国产乱码精品一区二区三区中文| 亚洲av中文无码乱人伦在线视色| 亚洲精品偷拍| www亚洲精品| 97人妻精品一区二区三区免费| 欧美第一在线视频| 精品精品国产高清一毛片一天堂| 波多野结衣作品集| 在线观看精品| 亚洲一区二区免费视频| 区一区二区三区中文字幕| 嫩草研究院在线观看| 国产一区二区0| 2020欧美日韩在线视频| 日本亚洲色大成网站www久久| 精品久久中文| 亚洲第一视频网| 欧美在线aaa| 91嫩草国产线观看亚洲一区二区| 岛国视频午夜一区免费在线观看| 免费观看黄色的网站| 你懂的在线网址| 亚洲国产高清不卡| 中国一级黄色录像| 337p日本欧洲亚洲大胆鲁鲁| 成人免费视频一区| 国产自产女人91一区在线观看| 91无套直看片红桃| 久久综合网络一区二区| 国产精品一区二区三区免费视频 | 狠狠色综合一区二区| 亚洲人视频在线观看| 中文字幕成人网| 久久av高潮av| 国产在线高清理伦片a| 久久影院电视剧免费观看| 99在线影院| 国产又大又粗又硬| 成人精品在线视频观看| 日本精品一区二区三区高清 久久| aaa在线免费观看| 亚洲一二三区不卡| 一路向西2在线观看| 综合激情五月婷婷| 日韩欧美一区在线观看| 91精品999| 国产一区高清| 欧美亚一区二区| 国产调教打屁股xxxx网站| 国产精品xnxxcom| 欧美乱妇15p| 夜夜夜夜夜夜操| 欧美美女啪啪| 亚洲免费视频网站| 91网站免费视频| 国产一区99| 中文字幕国内精品| www.99热| 欧美激情欧美| 麻豆成人在线看| 强行糟蹋人妻hd中文| 最新国产精品| 国产精品国产三级国产aⅴ9色| 男人天堂视频在线| 老色鬼精品视频在线观看播放| 国产精品嫩草影院久久久| 国产在线一级片| 美女网站色91| 亚洲一区二区三区在线视频| 国产富婆一级全黄大片| 成人免费观看av| 女女同性女同一区二区三区按摩| 美女写真久久影院| 亚洲国产精品va| 麻豆视频在线观看| 国产精品日本| 国产精品大片wwwwww| 性xxxx视频播放免费| 亚洲成人av一区| 成人在线免费播放视频| 欧美电影在线观看免费| 欧美极品少妇xxxxⅹ喷水| wwwwww国产| 青青青爽久久午夜综合久久午夜| 国产在线高清精品| av在线免费播放网站| 亚洲伦在线观看| 性生活免费在线观看| 欧美日韩一二三四| 国产脚交av在线一区二区| 91精品国产乱码久久久| 中文av一区二区| 日日干夜夜操s8| 手机在线电影一区| 国产在线观看91精品一区| 麻豆tv入口在线看| 午夜精品福利在线| 性生活免费在线观看| 不卡在线一区| 成人黄色在线观看| 日本高清成人vr专区| 欧美日韩在线免费| 日韩人妻一区二区三区| 久久综合九色综合欧美狠狠| 无遮挡亚洲一区| caoprom在线| 欧美日韩激情在线| 亚洲天堂美女视频| 久久99伊人| aa成人免费视频| av电影院在线看| 亚洲精品小视频在线观看| 青娱乐免费在线视频| 高清不卡一二三区| 伊人久久大香线蕉午夜av| а√在线中文网新版地址在线| 欧美久久免费观看| 国产亚洲自拍av| 91丨porny丨中文| 国产乱淫av片杨贵妃| 国产精品极品在线观看| 久久精品国产精品| 免费黄色一级大片| 亚洲天天做日日做天天谢日日欢 | 国产女人18毛片| 粉嫩的18在线观看极品精品| 欧美亚洲激情在线| 黄色网页在线看| 亚洲精品suv精品一区二区| 波多野结衣在线观看视频| 亚洲色图在线看| 亚洲精品乱码久久| 免费在线观看不卡| 丁香六月激情网| 国产亚洲高清在线观看| 久久理论片午夜琪琪电影网| av一区二区三| 欧美性猛交xxxxx水多| 亚洲精品国产成人av在线| 久久久久国产精品午夜一区| 国产免费一区二区三区四在线播放 | 亚洲电影在线| 一区二区高清视频| 香蕉人人精品| 69av视频在线播放| 免费观看a视频| 亚洲午夜国产一区99re久久| 欧美老熟妇乱大交xxxxx| 国产精品99久久久久| 在线观看18视频网站| 在线视频亚洲专区| 日本免费一区二区三区视频观看| 亚洲日本香蕉视频| 欧美一级欧美三级| 中文人妻熟女乱又乱精品| 国产日韩精品一区| 亚洲五月天综合| 国产精品一国产精品| 99国产视频| 国产精品久久久久77777丨| 欧美一级视频一区二区| 污污网站在线观看| 日韩小视频在线| 国产在线视频网址| 欧美日韩一区二区三区四区五区| 日韩激情在线播放| 亚洲中国最大av网站| 国产黄色三级网站| 麻豆亚洲精品| 久久国产精品网| 神马久久一区二区三区| 成人在线免费观看一区| 136福利第一导航国产在线| 神马国产精品影院av| 国产系列在线观看| 亚洲欧美日本另类| 视频国产一区二区三区| 在线观看欧美黄色| 久久久久在线视频| 激情亚洲一区二区三区四区| 国产色视频一区二区三区qq号| 丁香桃色午夜亚洲一区二区三区| 久久精品亚洲天堂| 亚洲精品乱码| 久久久久久www| 黄色免费成人| 日本成人看片网址| 竹菊久久久久久久| 日本视频精品一区| 国产成人三级| 日韩av高清| 日本一区二区三区播放| 97超级碰碰人国产在线观看| 国产精品69xx| 中文字幕亚洲欧美在线 | 精品人人人人| 精品中文字幕人| 亚洲欧美日本伦理| 欧美资源一区| 欧美午夜精彩| 宅男av一区二区三区| 91精品国产麻豆国产在线观看 | 久久99热狠狠色一区二区| 黄色三级中文字幕| 激情久久久久久| 亚洲自偷自拍熟女另类| 久久久久av| 日韩精品一区二区免费| 亚洲免费激情| 成年在线观看视频| 在线精品亚洲| 久久九九国产视频| 国内久久婷婷综合| 日韩中文字幕免费在线| 青娱乐精品在线视频| 黑人巨大猛交丰满少妇| 蜜臀久久久久久久| 在线观看日本www| 成人一级片在线观看| 不卡一区二区在线观看| 国产精品主播直播| 亚洲综合自拍网| 中文字幕乱码亚洲精品一区| 男女性高潮免费网站| 国产精品美女一区二区三区 | 久久久国产午夜精品| 美女网站视频在线观看| 国内国产精品久久| 亚洲天堂av网站| 国产日韩精品一区二区三区在线| 97成人资源站| 欧美午夜美女看片| 国产又粗又猛视频| 日韩精品视频免费专区在线播放| 国产美女性感在线观看懂色av| 美女国内精品自产拍在线播放| a黄色在线观看| 色综合老司机第九色激情| 制服丝袜中文字幕在线| 国产91精品高潮白浆喷水| 四虎成人精品一区二区免费网站| 国产成人精品久久久| 欧美中文高清| 婷婷久久伊人| 一本色道久久综合亚洲精品高清 | 91蝌蚪porny九色| 91狠狠综合久久久| 国产精品久久久久久一区二区三区 | 青青久久av北条麻妃黑人| 91亚洲精品在看在线观看高清| 久久狠狠久久综合桃花| 精品日产乱码久久久久久仙踪林| 日本在线播放不卡| 最新亚洲一区| 免费国偷自产拍精品视频| 国产色产综合色产在线视频 | 色成人在线视频| 中文字幕手机在线视频| 精品久久国产97色综合| 麻豆影视国产在线观看| 国产成人精品在线播放| 林ゆな中文字幕一区二区| www国产免费| 九九视频精品免费| 美女100%露胸无遮挡| 国产精品久久久久久久久久免费看 | 久久久久久久91| 亚洲我射av| 亚洲国产精品一区二区第一页| 色综合五月天| 潘金莲一级淫片aaaaaa播放1| 久久只有精品| 少妇精品一区二区| 欧美国产乱子伦| 欧美日韩综合一区二区三区| 亚洲第一福利网| 免费影视亚洲| av在线亚洲男人的天堂| 亚洲精品电影| 在线一区二区不卡| 中文字幕制服丝袜成人av| 中文字幕一区二区人妻痴汉电车| 亚洲毛片在线观看.| 午夜伦理福利在线| 国产一区深夜福利| 成人情趣视频| 国产野外作爱视频播放| 国产精品欧美极品| 中文字幕制服诱惑| 日韩一区视频在线| 91精品国产一区二区在线观看| 伊人婷婷久久| 国产自产视频一区二区三区| 日本高清不卡免费| 欧美一级国产精品| 牛牛精品在线| 国产一区在线免费观看| 91偷拍一区二区三区精品| 美女在线视频一区二区| 国产精品情趣视频| 国产精品伦一区二区三区| 欧美成人免费在线视频| 77成人影视| 成人免费观看cn| xf在线a精品一区二区视频网站| 国产成人精品一区二三区| 欧美一区二区在线观看| 黄色片免费在线| 国产精品欧美日韩久久| 婷婷亚洲综合| 嫩草av久久伊人妇女超级a| 国产精品五月天| 国产视频一二三四区| 久久久久久久91| 国产一区二区观看| 久久久久久久久久一区| 亚洲香蕉伊在人在线观| 毛片免费在线播放| 91老司机精品视频| 超碰成人久久| 污污视频网站在线| 亚洲一区影音先锋| 日韩精品福利| 国产做受高潮69| 国产探花在线精品一区二区| 亚洲成人天堂网| 亚洲国产精品影院| 成人精品福利| 国产精品v欧美精品v日韩| 老司机精品久久| 麻豆亚洲av熟女国产一区二| 精品呦交小u女在线| 日韩一级视频| 欧美啪啪免费视频| 中文字幕视频一区| 中文字幕一区二区三区免费看| 美日韩在线视频| 亚洲免费毛片| 免费黄色av网址| 欧美三级视频在线观看| sm久久捆绑调教精品一区| 一区二区三区一级片| 久久人人97超碰com| 亚洲第一免费视频| 欧美激情影音先锋| 成人一级毛片| 国产精品第七页|