精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

等不來OpenAI的Q*,華為諾亞探索LLM推理的秘密武器MindStar先來了

人工智能 新聞
本文介紹了 MindStar(M*),一種新穎的基于搜索的推理框架,用于增強預訓練大型語言模型的推理能力。通過將推理任務視為搜索問題并利用過程監督的獎勵模型,M* 在推理樹空間中有效導航,識別近似最優路徑。

本論文作者來自華為蒙特利爾諾亞方舟實驗室的康計堃,李信擇,陳熙, Amirreza Kazemi,陳博興。

人工智能(AI)在過去十年里取得了長足進步,特別是在自然語言處理和計算機視覺領域。然而,如何提升 AI 的認知能力和推理能力,仍然是一個巨大的挑戰。

近期,一篇題為《MindStar: Enhancing Math Reasoning in Pre-trained LLMs at Inference Time》的論文提出了基于樹搜索的推理時間能力提升方法 MindStar [1],該方法在開源模型 Llama-13-B 與 Mistral-7B 上達到了近似閉源大模型 GPT-3.5 與 Grok-1 在數學問題上的推理能力。

圖片

  • 論文標題:MindStar: Enhancing Math Reasoning in Pre-trained LLMs at Inference Time
  • 論文地址:https://arxiv.org/abs/2405.16265v2

MindStar 在數學問題上的應用效果:

圖片

圖 1 :不同大型語言模型的數學準確率。LLaMA-2-13B 在數學性能上與 GPT-3.5 (4-shot) 類似,但節省了大約 200 倍的計算資源。

1. 引言

隨著模型規模的快速增長,基于 Transformer 的大型語言模型(LLMs)在指令遵循 [1,2]、編碼輔助 [3,4] 和創意寫作 [5] 等領域展示了令人印象深刻的成果。然而,解鎖 LLMs 解決復雜推理任務的能力仍然是一大挑戰。最近的一些研究 [6,7] 嘗試通過監督微調(Supervised Fine-Tuning, SFT)來解決,通過將新的推理數據樣本與原始數據集混合,使 LLMs 學習這些樣本的底層分布,并嘗試模仿所學邏輯來解決未見過的推理任務。盡管這種方法有性能提升,但它嚴重依賴于大量的訓練和額外的數據準備 [8,9]。

Llama-3 報告 [10] 強調了一個重要的觀察:當面對一個具有挑戰性的推理問題時,模型有時會生成正確的推理軌跡。這表明模型知道如何產生正確答案,但在選擇上存在困難。基于這一發現,我們提出了一個簡單的問題:我們能否通過幫助 LLMs 選擇正確的輸出來增強它們的推理能力?為探索這一點,我們進行了一項實驗,利用不同的獎勵模型進行 LLMs 輸出選擇。實驗結果表明,步驟級選擇顯著優于傳統的 CoT 方法。

2. MindStar 方法

圖片

圖 2 MindStar 的算法架構圖

我們引入了一種新的推理搜索框架 ——MindStar(M*),通過將推理任務視為搜索問題,并利用過程監督的獎勵模型(Process-supervised Reward Model, PRM),M * 在推理樹空間中有效導航,識別近似最優路徑。結合束搜索(Beam Search, BS)和 Levin 樹搜索(Levin Tree Search, LevinTS)的思想,進一步增強了搜索效率,并保證在有限計算復雜度內找到最佳推理路徑。

2.1 過程監督獎勵模型

過程監督獎勵模型 (PRM) 的設計目的是評估大語言模型 (LLM) 生成的中間步驟,以幫助選擇正確的推理路徑。這種方法借鑒了其他應用中 PRM 的成功經驗。具體而言,PRM 以當前推理路徑圖片和潛在的下一步圖片作為輸入,并返回獎勵值圖片

PRM 通過考慮整個當前推理軌跡來評估新步驟,鼓勵與整體路徑的一致性和忠實性。高獎勵值表明,新的步驟圖片)對于給定的推理路徑圖片可能是正確的,從而使擴展路徑值得進一步探索。相反,低獎勵值則表示新步驟可能不正確,這意味著遵循此路徑的解決方案也可能不正確。

M* 算法包含兩個主要步驟,迭代直到找到正確的解決方案:

1. 推理路徑擴展:在每次迭代中,基礎 LLM 生成當前推理路徑的下一步。

2. 評估和選擇:使用 PRM 評估生成的步驟,并根據這些評估選擇下一次迭代的推理路徑。

2.2 推理路徑擴展

圖片

在選擇要擴展的推理路徑圖片后,我們設計了一個提示模板(Example 3.1),以從 LLM 中收集下一步。正如示例所示,LLM 將原始問題作為 {question},將當前推理路徑作為 {answer}。注意,在算法的第一次迭代中,所選擇的節點是僅包含問題的根節點,因此 {answer} 為空。對于推理路徑圖片,LLM 生成 N 個中間步驟,并將它們作為當前節點的子節點附加。在算法的下一步中,將評估這些新生成的子節點,并選擇一個新的節點進行進一步擴展。我們還意識到,生成步驟的另一種方法是使用步驟標記對 LLM 進行微調。然而,這可能會降低 LLM 的推理能力,更重要的是,這與本文的重點 —— 在不修改權重的情況下增強 LLM 推理能力相悖。

2.3 推理路徑選擇

在擴展推理樹后,我們使用預訓練的過程監督獎勵模型(PRM)來評估每個新生成的步驟。正如前面提到的,PRM 采用路徑和步驟 ,并返回相應的獎勵值。在評估之后,我們需要一種樹搜索算法來選擇下一個要擴展的節點。我們的框架不依賴于特定的搜索算法,在這項工作中,我們實例化了兩種最佳優先搜索方法,即 Beam Search 和 Levin Tree Search。

3. 結果與討論

在 GSM8K 和 MATH 數據集上的廣泛評估顯示,M * 顯著提升了開源模型(如 LLaMA-2)的推理能力,其表現可與更大規模的閉源模型(如 GPT-3.5 和 Grok-1)媲美,同時大幅減少了模型規模和計算成本。這些發現突顯了將計算資源從微調轉移到推理時間搜索的潛力,為未來高效推理增強技術的研究開辟了新途徑。

圖片

表 1 展示了各種方案在 GSM8K 和 MATH 推理基準上的對比結果。每個條目的數字表示問題解決的百分比。符號 SC@32 表示在 32 個候選結果中的自一致性,而 n-shot 表示少樣本例子的結果。CoT-SC@16 指的是在 16 個思維鏈(CoT)候選結果中的自一致性。BS@16 代表束搜索方法,即在每個步驟級別涉及 16 個候選結果,而 LevinTS@16 詳細說明了使用相同數量候選結果的 Levin 樹搜索方法。值得注意的是,MATH 數據集上 GPT-4 的最新結果為 GPT-4-turbo-0409,我們特別強調這一點,因為它代表了 GPT-4 家族中的最佳性能。

圖片

圖 3 我們研究了 M * 性能如何隨著步驟級別候選數量的變化而變化。我們選擇 Llama-2-13B 作為基礎模型,并分別選擇束搜索(BS)作為搜索算法。

圖片

圖 4 Llama-2 和 Llama-3 模型家族在 MATH 數據集上的尺度定律。所有結果均來自它們的原始資源。我們使用 Scipy 工具和對數函數來計算擬合曲線。

圖片

表 2 不同方法在回答問題時的平均 token 生產數量

4. 結論

本文介紹了 MindStar(M*),一種新穎的基于搜索的推理框架,用于增強預訓練大型語言模型的推理能力。通過將推理任務視為搜索問題并利用過程監督的獎勵模型,M* 在推理樹空間中有效導航,識別近似最優路徑。結合束搜索和 Levin 樹搜索的思想,進一步增強了搜索效率,并保證在有限計算復雜度內找到最佳推理路徑。廣泛的實驗結果表明,M* 顯著提升了開源模型的推理能力,其表現可與更大規模的閉源模型媲美,同時大幅減少了模型規模和計算成本。

這些研究成果表明,將計算資源從微調轉移到推理時間搜索具有巨大的潛力,為未來高效推理增強技術的研究開辟了新途徑。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2013-10-16 09:28:14

亞馬遜AWSSDN

2024-04-08 08:03:00

ChatGPTOpenAI大語言模型

2013-10-16 09:33:36

亞馬遜AWSSDN

2015-03-30 16:58:05

秘密武器華為

2014-01-07 10:46:39

2011-08-11 17:05:26

2024-07-15 08:40:00

2022-02-11 10:47:17

CIOIT團隊企業

2019-11-27 10:38:37

數據分析數據準備工具

2025-05-14 00:01:10

RxJS異步編程響應式

2009-07-28 10:36:58

云計算Google秘密武器

2021-04-27 10:36:59

計算

2023-05-08 14:54:00

AI任務HuggingGPT

2019-11-27 10:40:34

數據工具CIO

2024-07-11 08:34:48

2025-05-27 10:00:00

Python數據類代碼

2019-02-27 09:44:01

CIO秘密武器顧問

2025-01-06 23:33:04

2025-07-14 09:03:00

2023-02-24 10:26:34

語音AI人工智能
點贊
收藏

51CTO技術棧公眾號

国产精品嫩草影院com| 日韩午夜免费视频| 91精品久久久久久久99蜜桃| 男女爱爱视频网站| 亚洲第九十九页| 亚洲一区网站| www国产精品com| 亚洲av无一区二区三区久久| а√天堂8资源在线| 国产亚洲精品资源在线26u| 国产日本欧美一区二区三区在线| 免费一级片在线观看| 国产a久久精品一区二区三区| 538在线一区二区精品国产| 欧美黑人经典片免费观看| h网站视频在线观看| 国产99精品视频| 国产精品夫妻激情| 国产亚洲精品久久久久久打不开 | av成人手机在线| 国产高清成人在线| 国产精品久久久久久久av电影 | 少妇一级淫片免费放播放| 日韩制服一区| 午夜精品久久久久久| 一区在线电影| 免费在线观看污视频| 国产suv一区二区三区88区| 国产精品国模在线| 青青草成人av| 欧美精品网站| 日韩视频―中文字幕| 国产熟妇久久777777| 第一区第二区在线| 7777精品伊人久久久大香线蕉最新版| 免费看日本毛片| 啦啦啦中文在线观看日本| 欧美国产精品中文字幕| 欧美国产一区二区在线| 色丁香婷婷综合久久| 国产成人午夜视频| 亚洲精品欧美日韩| 一级特黄aaa| 日本成人在线电影网| 热久久这里只有| 毛片视频网站在线观看| 今天的高清视频免费播放成人| 久久亚洲精品一区二区| 国产日产精品一区二区三区的介绍| 夜色77av精品影院| 日韩黄色高清视频| 美女又爽又黄视频毛茸茸| 99a精品视频在线观看| 日韩精品一区二区三区老鸭窝| 天天摸天天舔天天操| 国语自产精品视频在线看抢先版结局 | 欧洲精品久久| 九色视频在线观看免费播放 | 调教驯服丰满美艳麻麻在线视频| 人人精品视频| 精品呦交小u女在线| 动漫美女无遮挡免费| 香蕉大人久久国产成人av| 91精品国产综合久久久久久| 毛毛毛毛毛毛毛片123| 成人黄色理论片| 欧美一区二区观看视频| 日韩av一卡二卡三卡| av成人在线播放| 欧洲精品中文字幕| 激情六月丁香婷婷| 黄色软件视频在线观看| 日韩欧美福利视频| www.浪潮av.com| 男人最爱成人网| 欧美在线观看视频一区二区| 欧美日韩理论片| 一区中文字幕电影| 亚洲第一级黄色片| 欧美熟妇精品黑人巨大一二三区| 欧美禁忌电影| 日韩在线免费视频观看| 免费在线一级片| 国产精品资源| 国产在线a不卡| 99在线精品视频免费观看20| 成人福利电影精品一区二区在线观看| 精品国产一区二区三区麻豆免费观看完整版 | 狠狠久久亚洲欧美| 国产伦精品一区二区三区在线| 青梅竹马是消防员在线| 中文字幕国产一区二区| 99视频精品全部免费看| 亚洲人体视频| 91精品午夜视频| 三级电影在线看| 竹菊久久久久久久| 日韩小视频在线| 日韩女同强女同hd| 久久国产剧场电影| 国产高清一区二区三区| 超碰在线国产| 亚洲国产精品嫩草影院| 国产三级三级三级看三级| 久久影院一区二区三区| 亚洲精品综合精品自拍| 多男操一女视频| av成人黄色| 成人欧美一区二区三区在线| 色综合久久久久久| 国产精品精品国产色婷婷| 亚洲人成无码网站久久99热国产 | 欧美日韩偷拍视频| 日韩精品亚洲一区二区三区免费| 91中文字幕在线观看| 色视频在线观看| 亚洲精品水蜜桃| 国产一区视频免费观看| 亚洲1区在线观看| 亚洲天堂久久av| 日韩免费不卡视频| 国产在线精品一区二区三区不卡 | 九色在线观看| 亚洲无线码一区二区三区| 午夜久久久精品| 亚州国产精品| 欧美激情综合色| 97成人在线观看| 久久精品网站免费观看| 欧美视频在线观看网站| 伊人www22综合色| 美女福利视频一区| 一区二区三区精| 国产欧美日本一区二区三区| 99精品视频在线看| 另类在线视频| 69av成年福利视频| 日本黄色三级视频| 亚洲一区二区视频在线观看| 亚洲第一区第二区第三区| 日韩黄色大片网站| 国产精品久久久久久久久久| 欧洲毛片在线| 色屁屁一区二区| 精品人伦一区二区三电影| 亚洲欧美bt| 欧美lavv| 春暖花开亚洲一区二区三区| 亚洲人成在线一二| 久久精品五月天| 国产欧美日产一区| 久久人人爽av| 亚洲理论电影网| 亚洲最大福利视频网| 菠萝菠萝蜜在线视频免费观看| 91麻豆精品国产自产在线| 久久久99999| 国产一区二区福利视频| 热久久最新网址| 98视频精品全部国产| 97视频免费看| 可以在线观看的av| 在线欧美日韩精品| 激情五月深爱五月| 国产在线国偷精品免费看| 永久免费看av| 国产精品白丝av嫩草影院| 69av视频在线播放| 毛片免费在线观看| 欧美三级欧美一级| 成人免费视频网站入口::| 国产精品1区二区.| 免费av观看网址| 国产精品一线天粉嫩av| 国产美女主播一区| 在线中文字幕电影| 日韩精品免费在线视频| 无码任你躁久久久久久久| 国产精品久久久久影院色老大| 91热视频在线观看| 在线观看亚洲| 日韩高清dvd| 国产一区 二区| 97久久精品国产| www黄在线观看| 日韩美女主播在线视频一区二区三区 | 国产欧美亚洲精品| 深夜国产在线播放| 亚洲欧美国产精品专区久久 | 国产一区二区三区四区五区入口| 国产夫妻自拍一区| 精品国产乱码久久久久久1区2匹| 成人精品aaaa网站| 麻豆视频在线看| 日韩在线观看免费| 亚洲欧美色视频| 91精品国产色综合久久不卡电影 | 精品剧情v国产在线观看在线| 中日韩精品视频在线观看| 国产精品午夜春色av| 亚洲视频在线播放免费| 日本大胆欧美人术艺术动态| 国产精品入口芒果| 91视频一区| 久久影视中文粉嫩av| 国产精品va视频| 国产aaa精品| 激情图片在线观看高清国产| 在线日韩第一页| 五月婷婷六月激情| 91精品国产综合久久福利软件| 综合激情网五月| 久久av二区| 污片在线免费观看| 亚洲一级免费视频| 日韩国产一级片| 亚洲97av| 不卡视频一区| 欧美黄页免费| 国产精品1234| 高清毛片在线观看| 久久99视频精品| 亚洲视频tv| 亚洲日本欧美中文幕| 亚洲精品久久久久久久久久| 欧美日韩三级一区| 久久国产视频一区| 亚洲福利视频三区| 裸体武打性艳史| 中文字幕免费观看一区| wwwwxxxx国产| 91首页免费视频| 久久久无码人妻精品无码| 韩国精品免费视频| 日韩一区二区三区久久| 日韩精品久久久久久| 成人羞羞国产免费网站| 国产农村妇女精品一二区| 欧美精品久久久久久久久久久| 亚洲综合激情在线| 一区二区三区av在线| 日韩大片在线播放| 视频一区视频二区视频三区视频四区国产| 欧美黑白配在线| 国产一区二区不卡视频在线观看| silk一区二区三区精品视频| av一区二区三区免费| 麻豆一二三区精品蜜桃| 亚洲自拍中文字幕| 欧洲大片精品免费永久看nba| 亚洲一区二区三区xxx视频| 99久久久国产| 亚洲自拍偷拍第一页| 视频一区视频二区欧美| 国产成人看片| 欧美精品中文| 六月婷婷久久| 国内精品视频在线观看| 日韩精品不卡| 欧美呦呦网站| 亚洲一区二区三区加勒比| 999精品视频| 在线观看污视频| 在线精品亚洲| 六月丁香婷婷在线| 蜜臀久久99精品久久久久宅男 | 精品一区二区三孕妇视频| 中文字幕不卡在线| 免费黄色国产视频| 亚洲精品中文字幕乱码三区| 久久精品无码人妻| 婷婷亚洲久悠悠色悠在线播放 | heyzo在线欧美播放| 午夜剧场成人观在线视频免费观看| 人狥杂交一区欧美二区| 国产成人精彩在线视频九色| 四虎影视成人精品国库在线观看| 亚洲一区二区三区四区视频| 99re6热只有精品免费观看| 久久精品99| 欧美国产一区二区三区激情无套| 看一级黄色录像| 国产精品视区| 色婷婷一区二区三区av免费看| 国产精品白丝av| 18禁裸乳无遮挡啪啪无码免费| 国产精品久久午夜夜伦鲁鲁| 国产小视频在线看| 欧美在线短视频| 超碰福利在线观看| 亚洲视频在线观看视频| 18+视频在线观看| 国产va免费精品高清在线| 亚洲狼人综合| 久久婷婷开心| 中文字幕亚洲综合久久五月天色无吗''| 成人一区二区免费视频| 久久精品国产精品亚洲精品| 黄色在线免费播放| 国产精品久久精品日日| 国产午夜性春猛交ⅹxxx| 欧美一区二区观看视频| 国产高清在线观看| 97精品久久久| 大胆国模一区二区三区| 欧美日韩一区二| 亚洲三级网站| 佐山爱在线视频| 欧美国产成人在线| 国产a∨精品一区二区三区仙踪林| 欧美久久久久免费| 欧美成人片在线| 久久男人资源视频| 国产麻豆一区二区三区| 亚洲国产日韩综合一区| 亚洲一区二区三区四区五区午夜| 99久久99精品| 国产精品丝袜黑色高跟| 亚洲熟女综合色一区二区三区| 日韩精品一区国产麻豆| 精精国产xxxx视频在线| 国产精品久久久久久久久久久不卡 | 国产女人被狂躁到高潮小说| 91久久线看在观草草青青| 日日夜夜精品免费| 欧美激情精品久久久久久变态| 久久天天久久| 亚洲激情一区二区| 久久尤物视频| 巨胸大乳www视频免费观看| 亚洲国产综合色| 亚洲精品无遮挡| 欧美久久精品午夜青青大伊人| 欧美高清xxx| 一区不卡字幕| 美女久久久精品| 亚洲无人区码一码二码三码的含义| 岛国av一区二区三区| 天堂在线资源8| 国内精品视频久久| aaa国产精品| 欧日韩免费视频| 不卡电影一区二区三区| 国产 日韩 欧美 成人| 精品少妇一区二区三区在线视频| 直接在线观看的三级网址| 91情侣偷在线精品国产| 亚洲最新色图| 操人视频免费看| 一区二区在线观看免费| 亚洲高清视频在线播放| 午夜精品理论片| 全国精品免费看| aⅴ在线免费观看| 国产欧美中文在线| 中文字幕一区二区免费| 日韩最新av在线| 视频一区日韩精品| av免费看网址| 久久先锋资源网| 自拍偷拍第八页| 欧美成人精品不卡视频在线观看| 一区二区三区亚洲变态调教大结局| www成人免费| 91视频国产观看| 成人一级免费视频| 日韩亚洲欧美成人| 久久gogo国模啪啪裸体| 亚洲国产精品无码观看久久| 91亚洲精品久久久蜜桃网站 | 宅男一区二区三区| 国产一区二区视频在线播放| 麻豆视频在线观看| 日韩精品视频在线播放| 78精品国产综合久久香蕉| 黄色高清视频网站| www.欧美色图| 中文字幕免费播放| 欧美日韩国产成人在线| 久久香蕉网站| 性chinese极品按摩| 亚洲一区二区在线视频| 蜜桃视频在线观看网站| 成人黄色大片在线免费观看| 亚洲国产日韩在线| 91精品久久久久久久久久久久| 欧美一级夜夜爽| 女人高潮被爽到呻吟在线观看| 日日骚一区二区网站| 国产成人综合亚洲网站| 精品人妻一区二区三区潮喷在线| 久久精品久久久久久| 欧美aaaaaaaa牛牛影院| 伊人色在线视频| 狠狠躁夜夜躁久久躁别揉| 毛片在线播放a| 蜜桃av色综合| 成人综合在线观看| 亚洲性猛交富婆| 国语自产精品视频在免费|