精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

百倍提升7B模型推理能力!顏水成團(tuán)隊(duì)攜手新加坡南洋理工大學(xué)發(fā)布Q*算法

發(fā)布于 2024-6-26 09:42
瀏覽
0收藏

自O(shè)penAI的Q項(xiàng)目曝光后,業(yè)內(nèi)相關(guān)討論始終層出不窮。 據(jù)現(xiàn)有信息匯總,Q項(xiàng)目被視作OpenAI在探索人工通用智能(Artificial General Intelligence, AGI)道路上的一次重大嘗試,有望在包括數(shù)學(xué)問(wèn)題解決能力、自主學(xué)習(xí)和自我改進(jìn)等多個(gè)層面對(duì)人工智能技術(shù)帶來(lái)革新性突破。

百倍提升7B模型推理能力!顏水成團(tuán)隊(duì)攜手新加坡南洋理工大學(xué)發(fā)布Q*算法-AI.x社區(qū)

百倍提升7B模型推理能力!顏水成團(tuán)隊(duì)攜手新加坡南洋理工大學(xué)發(fā)布Q*算法-AI.x社區(qū)

(英偉達(dá)科學(xué)家Jim Fan、圖靈獎(jiǎng)得主Yann LeCun等參與討論OpenAI的Q*實(shí)現(xiàn)方式) 圖片

百倍提升7B模型推理能力!顏水成團(tuán)隊(duì)攜手新加坡南洋理工大學(xué)發(fā)布Q*算法-AI.x社區(qū)

(Meta科學(xué)家田淵棟則認(rèn)為Q是Q-learning和A的結(jié)合,且天然地適合推理任務(wù),尤其在數(shù)

學(xué)推理方面)


不過(guò)迄今為止OpenAI沒(méi)有公開(kāi)關(guān)于Q算法的具體細(xì)節(jié),其效果究竟如何我們并不得而知。 然而就在近日,一篇名為《Q: Improving Multi-step Reasoning for LLMs with Deliberative Planning》的論文在AI圈內(nèi)引發(fā)了不小的震蕩。

百倍提升7B模型推理能力!顏水成團(tuán)隊(duì)攜手新加坡南洋理工大學(xué)發(fā)布Q*算法-AI.x社區(qū)

論文鏈接:??https://arxiv.org/abs/2406.14283??


論文中提出的Q算法不僅能夠幫助小模型達(dá)到參數(shù)量比其大數(shù)十倍、甚至上百倍模型的推理能力,大幅提升了小模型的性能,還顯著降低了計(jì)算資源的需求。


最值得關(guān)注的是,這篇論文竟然出自中國(guó)團(tuán)隊(duì)之手——由顏水成教授團(tuán)隊(duì)攜手新加坡南洋理工大學(xué)團(tuán)隊(duì)共同發(fā)布!


根據(jù)實(shí)驗(yàn)結(jié)果,Q成功幫助現(xiàn)有開(kāi)源模型在GSM8K、MATH和MBPP數(shù)據(jù)集上取得性能飛躍,評(píng)分分別超越了ChatGPT和Gemini Ultra。

百倍提升7B模型推理能力!顏水成團(tuán)隊(duì)攜手新加坡南洋理工大學(xué)發(fā)布Q*算法-AI.x社區(qū)

(Q*在AI圈內(nèi)引發(fā)熱議)


百倍提升7B模型推理能力!顏水成團(tuán)隊(duì)攜手新加坡南洋理工大學(xué)發(fā)布Q*算法-AI.x社區(qū)

(外網(wǎng)網(wǎng)友直呼「中國(guó)AI趕上來(lái)了!」)


在《Q*: Improving Multi-step Reasoning for LLMs with Deliberative Planning》論文中,研究人員首先將大語(yǔ)言模型的推理軌跡分解為若干個(gè)狀態(tài)。


對(duì)于每一個(gè)狀態(tài),參考DeepCubeA中的設(shè)計(jì),通過(guò)將定義Path Cost的g(s_t)函數(shù)和定義Accumulated Reward的Q*(s_t, a_t)集成到同一個(gè)f(s_t)函數(shù)內(nèi),實(shí)現(xiàn)了對(duì)歷史狀態(tài)收益和未來(lái)期望收益的綜合考慮。


最后利用A搜索算法對(duì)狀態(tài)進(jìn)行最佳優(yōu)先搜索,實(shí)現(xiàn)了對(duì)復(fù)雜推理任務(wù)的全盤(pán)規(guī)劃,從而提升開(kāi)源模型在推理任務(wù)上的性能。

百倍提升7B模型推理能力!顏水成團(tuán)隊(duì)攜手新加坡南洋理工大學(xué)發(fā)布Q*算法-AI.x社區(qū)


其中g(shù)(s_t)表示當(dāng)前軌跡中的多個(gè)歷史狀態(tài),既{s1,...,s_t},的聚合收益。

百倍提升7B模型推理能力!顏水成團(tuán)隊(duì)攜手新加坡南洋理工大學(xué)發(fā)布Q*算法-AI.x社區(qū)


具體g(s_t)的函數(shù)形式可以通過(guò)人為定義,例如判斷當(dāng)前代碼是否符合語(yǔ)法規(guī)則等,或者通過(guò)構(gòu)建 Process Reward Model(PRM)進(jìn)行監(jiān)督學(xué)習(xí)得到;g(s_t)中的聚合方式可以為求和,最大值,最小值等。

百倍提升7B模型推理能力!顏水成團(tuán)隊(duì)攜手新加坡南洋理工大學(xué)發(fā)布Q*算法-AI.x社區(qū)

百倍提升7B模型推理能力!顏水成團(tuán)隊(duì)攜手新加坡南洋理工大學(xué)發(fā)布Q*算法-AI.x社區(qū)

為了獲得狀態(tài)-動(dòng)作對(duì)(s_t, a_t)的最優(yōu)Q值以實(shí)現(xiàn)規(guī)劃,研究人員在當(dāng)前LLM策略生成的數(shù)據(jù)上通過(guò)監(jiān)督學(xué)習(xí)的方式訓(xùn)練了一個(gè)代理Q值模型Q。


百倍提升7B模型推理能力!顏水成團(tuán)隊(duì)攜手新加坡南洋理工大學(xué)發(fā)布Q*算法-AI.x社區(qū)


實(shí)驗(yàn)結(jié)果表明,顏水成團(tuán)隊(duì)本次所提出的Q框架,可以顯著地提升LLM的推理能力:

  • 在GSM8K數(shù)據(jù)集上,Q幫助Llama-2-7b提升至80.8%的準(zhǔn)確率,超越了ChatGPT;
  • 在MATH數(shù)據(jù)集上,Q幫助DeepSeek-Math-7b提升至55.4%的準(zhǔn)確率,超越了Gemini Ultra;
  • 在MBPP數(shù)據(jù)集上,Q*幫助CodeQwen1.5-7b-Chat提升至77.0%的準(zhǔn)確率,縮小了與GPT-4的編程水平差距。

百倍提升7B模型推理能力!顏水成團(tuán)隊(duì)攜手新加坡南洋理工大學(xué)發(fā)布Q*算法-AI.x社區(qū)

百倍提升7B模型推理能力!顏水成團(tuán)隊(duì)攜手新加坡南洋理工大學(xué)發(fā)布Q*算法-AI.x社區(qū)

百倍提升7B模型推理能力!顏水成團(tuán)隊(duì)攜手新加坡南洋理工大學(xué)發(fā)布Q*算法-AI.x社區(qū)

研究證明,Q能夠幫助參數(shù)量?jī)H為7b的小模型達(dá)到參數(shù)量比其大數(shù)十倍甚至百倍模型的推理能力,大幅提升模型的性能,并顯著降低了計(jì)算資源的需求。


顏水成團(tuán)隊(duì)表示,目前,Q的研究尚在初級(jí)階段,算法在各個(gè)環(huán)節(jié)還有進(jìn)一步的改進(jìn)空間。未來(lái),團(tuán)隊(duì)會(huì)繼續(xù)深入此項(xiàng)研究,不斷提升國(guó)產(chǎn)開(kāi)源模型推理能力,打破OpenAI閉源封鎖,為人工智能前沿技術(shù)發(fā)展帶來(lái)全新可能。


本文轉(zhuǎn)自 新智元,作者:新智元


原文鏈接:??https://mp.weixin.qq.com/s/5zaE62vFQg-v_gx2o6Dmdg??

標(biāo)簽
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
av免费观看久久| 最新中文字幕亚洲| 5月婷婷6月丁香| 精华区一区二区三区| 美女视频黄免费的久久| 久久天天躁狠狠躁夜夜躁2014| 国产5g成人5g天天爽| 高清电影在线观看免费| 国产日韩欧美一区二区三区综合| 成人欧美一区二区三区黑人| 国产真实的和子乱拍在线观看| 国产欧美一区二区三区精品观看| 91精品婷婷国产综合久久竹菊| 拔插拔插海外华人免费| 精品电影在线| 成+人+亚洲+综合天堂| 国产精品久久激情| 久久久久久久久久99| 青青草原综合久久大伊人精品| 欧美一二三在线| 欧美日韩在线免费播放| 欧美黄色视屏| 中文字幕一区av| 欧美二级三级| 日韩在线观看视频一区| 久99久精品视频免费观看| 欧美一级大片在线观看| 欧美激情一区二区视频| 久久一区二区三区电影| 亚洲精品天天看| 免费人成视频在线播放| 国产麻豆久久| 欧美日韩中文字幕综合视频| 三级在线免费观看| 91se在线| 国产婷婷色一区二区三区四区| 国产综合18久久久久久| 99久久久久成人国产免费 | 妺妺窝人体色www看人体| 国产精品久久久久久久龚玥菲 | 国产精品高清无码在线观看| 精品自拍视频| 在线视频一区二区免费| 国产亚洲精品网站| 丰乳肥臀在线| 亚洲一区二区三区中文字幕| 欧美另类videos| 欧美日韩在线资源| 中文字幕av不卡| 日本公妇乱淫免费视频一区三区| 天天综合天天色| av中文字幕不卡| 国产日韩一区欧美| 欧美性猛交 xxxx| 本田岬高潮一区二区三区| 91观看网站| 午夜精品久久久久久久91蜜桃| 久久99国产精品久久99| 91视频九色网站| 99久久久国产精品无码免费| 国产成人在线看| 91九色露脸| 亚洲欧美另类综合| 成人精品鲁一区一区二区| 国产精品精品软件视频| 黄色一级a毛片| 94色蜜桃网一区二区三区| 国产自产在线视频一区| 三级理论午夜在线观看| 国产亚洲精品福利| 亚洲 国产 日韩 综合一区| a视频网址在线观看| 中文欧美字幕免费| 一区二区三区视频| a级网站在线播放| 亚洲国产欧美一区二区三区丁香婷| 日韩a级黄色片| 色是在线视频| 欧美亚洲精品一区| 五月天丁香花婷婷| 亚洲超碰在线观看| 日韩经典中文字幕| 亚洲无人区码一码二码三码的含义| 日本女优一区| 美女视频久久黄| 国产无遮挡又黄又爽| 久久久精品午夜少妇| 国产精自产拍久久久久久| 国产三级视频在线播放| 9久草视频在线视频精品| 欧美影视一区二区| 国产黄色在线免费观看| 欧美日韩国产麻豆| 五月天激情视频在线观看| 日韩欧美中文字幕一区二区三区| 亚洲成人网在线观看| 夜夜春很很躁夜夜躁| 午夜国产一区| 欧美中文字幕在线视频| 国产精品久久久久久免费| 成人免费福利片| 亚洲伊人婷婷| 98色花堂精品视频在线观看| 欧美色图天堂网| 日本国产在线视频| 日韩欧美一区二区三区在线视频| 国内精品模特av私拍在线观看| 精品乱码一区内射人妻无码 | 亚洲综合自拍网| 999视频精品| 136fldh精品导航福利| 一区二区三区播放| www成人在线观看| 国产日产欧美一区二区| 日韩成人亚洲| 亚洲精品久久久久久久久| 国产视频精品免费| 亚洲一区二区毛片| 97人人模人人爽人人喊38tv| 国产在线超碰| 欧美日韩亚洲激情| 少妇精品无码一区二区| 日韩精品免费一区二区三区| 91精品国产精品| www.日本在线观看| 亚洲欧美综合色| 波多野结衣天堂| 久久99视频| 51精品国产黑色丝袜高跟鞋| 亚洲av综合色区无码一二三区| 中文字幕欧美一| 黄色免费网址大全| 久草在线成人| 91超碰中文字幕久久精品| 成人免费视频国产| 亚洲精品乱码久久久久久黑人| 亚洲天堂2018av| 青青草国产成人a∨下载安卓| 欧美在线观看日本一区| 欧美熟女一区二区| 午夜精品福利一区二区三区蜜桃| 波多野结衣网页| 欧美日本二区| 成人三级视频在线观看一区二区| 国产精品实拍| 91精品国产色综合久久不卡电影| 成人做爰视频网站| 麻豆免费精品视频| 亚洲精美视频| 亚洲欧洲一二区| 久久五月情影视| 99国产精品久久久久99打野战| 1024亚洲合集| 国产sm在线观看| 欧美三区美女| 激情小说综合网| 在线天堂新版最新版在线8| 亚洲国产精品yw在线观看| 一级片免费网址| 91在线视频播放| 欧美 日韩精品| 免费成人高清在线视频theav| 欧洲美女免费图片一区| 国产69精品久久app免费版| 欧美又粗又大又爽| 天美传媒免费在线观看| 国产一区二区三区美女| 国产精品无码电影在线观看| 国产精品美女在线观看直播| 日本精品视频网站| 素人av在线| 日韩欧美自拍偷拍| 国产精品99无码一区二区| av在线播放成人| 无遮挡又爽又刺激的视频| 日韩电影二区| 91久久精品国产91久久性色tv| 日本三级韩国三级欧美三级| 亚洲精品日韩在线| 在线观看黄色网| 亚洲一区二区成人在线观看| 黄色性生活一级片| 毛片av一区二区| 阿v天堂2018| 精品久久中文| 成人免费视频视频在| 亚洲天堂资源| www日韩欧美| 四虎永久在线精品免费网址| 欧美午夜精品久久久| 久久久久人妻一区精品色欧美| 久久综合成人精品亚洲另类欧美| 国产永久免费网站| 亚洲日本黄色| 正在播放一区二区三区| 精品国产午夜肉伦伦影院| 国产精品福利网| 不卡av免费观看| 最近2019中文字幕mv免费看| 神马午夜一区二区| 7777女厕盗摄久久久| 日本天堂网在线| 亚洲精品综合在线| 免费人成又黄又爽又色| 成人午夜精品一区二区三区| 一区二区xxx| 亚洲一区免费| 欧美一区二区激情| 国产精品久久久久久久久久10秀 | 亚洲国产精品一区二区久久恐怖片| 西西444www无码大胆| 国产精品一级片在线观看| 青青草av网站| 亚洲美女一区| 青青视频免费在线| 欧美一区二区三区激情视频| 精品国产一二| 中文字幕日韩在线| 成人h视频在线观看播放| 日韩成人动漫| 国产91|九色| 国产www视频在线观看| 久久精品国产欧美激情| www.av在线播放| 日韩精品在线免费播放| 好吊视频一二三区| 欧美大黄免费观看| 97人妻精品一区二区三区视频| 日本韩国精品一区二区在线观看| 久草精品视频在线观看| 亚洲女子a中天字幕| 女教师淫辱の教室蜜臀av软件| 91丨porny丨最新| 久久久久久婷婷| 粉嫩av亚洲一区二区图片| 中文字幕亚洲影院| 精品一区二区三区在线播放| 亚洲精品久久久中文字幕| 久久综合九色综合欧美狠狠| 尤物av无码色av无码| 99国产精品久久久久久久成人热 | 少妇视频一区二区| 国产欧美日韩在线视频| japanese中文字幕| 国产片一区二区| 免费看一级黄色| 中文字幕一区日韩精品欧美| 中国1级黄色片| 中文字幕一区二区三区精华液 | 色久综合一二码| 中文字幕69页| 在线亚洲一区观看| 中文字幕一级片| 欧美日本一区二区在线观看| 亚洲综合网av| 日韩一区二区三区四区| www.成人免费视频| 亚洲大胆人体视频| 性xxxx视频| 亚洲午夜av电影| 成人资源www网在线最新版| 中文字幕欧美日韩精品| 男人的天堂在线视频免费观看| 日韩中文字幕在线免费观看| 黄色免费在线看| 久久久久久久久国产| 国模精品视频| 国产精品第二页| 亚洲资源在线| 国产乱码精品一区二区三区卡| 婷婷精品在线观看| 亚洲春色在线视频| 欧美福利电影在线观看| 青青青免费在线| 欧美a级一区二区| 最好看的中文字幕| 99re这里只有精品6| xxxx日本黄色| 伊人婷婷欧美激情| 久久久久久91亚洲精品中文字幕| 欧美性一区二区| 亚洲精品久久久蜜桃动漫 | 午夜dj在线观看高清视频完整版| 久久久久久久av| 韩国成人在线| 国产激情一区二区三区在线观看| 日韩深夜影院| 性生活免费观看视频| 日韩一区二区久久| 亚洲激情在线看| 91老师国产黑色丝袜在线| 欧美另类videoxo高潮| 香蕉成人伊视频在线观看| 无码人妻丰满熟妇精品| 91麻豆精品国产91久久久久| 亚洲欧洲成人在线| 久久精品成人欧美大片| 夜鲁夜鲁夜鲁视频在线播放| 成人福利视频在线观看| 亚洲动漫在线观看| 男人天堂网站在线| 日本亚洲一区二区| 中文字幕天堂网| 精品国产99久久久久久| 精品福利一区| 日本一区二区高清视频| 亚洲无吗在线| 99九九99九九九99九他书对| 99久久99久久综合| 黄色香蕉视频在线观看| 欧美性猛交xxxxx水多| 亚洲av综合色区无码一二三区| 中文字幕久久亚洲| 欧美aa免费在线| 成人h视频在线观看| 日本一二区不卡| 国产精品99久久免费黑人人妻| 成人国产精品免费观看| 希岛爱理中文字幕| 欧美午夜一区二区三区免费大片| 亚洲 国产 欧美 日韩| 欧美成人黄色小视频| 色综合视频一区二区三区44| 欧美日韩一区综合| 亚洲在线免费| 日韩成人av一区二区| 亚洲在线视频网站| 国产毛片在线视频| 最近中文字幕日韩精品 | 国产美女91呻吟求| 久久综合影院| 最近免费中文字幕中文高清百度| 91亚洲男人天堂| 欧美亚洲天堂网| 精品美女在线观看| 青草影视电视剧免费播放在线观看| 国产一区欧美二区三区| 色777狠狠狠综合伊人| 午夜免费高清视频| 欧美国产日韩亚洲一区| 色一情一乱一伦| 亚洲免费影视第一页| 伊人成综合网站| 欧美午夜精品久久久久久蜜| 香蕉国产精品偷在线观看不卡| 天天躁日日躁狠狠躁av| 亚洲成人av电影在线| 亚洲AV无码一区二区三区少妇| 欧美超级免费视 在线| 日韩有吗在线观看| 女人被男人躁得好爽免费视频| 国产成人在线视频免费播放| 国产亚洲第一页| 亚洲国产天堂网精品网站| 天堂资源在线| 日韩中文字幕一区| 久久精品国产99| 欧美日韩精品亚洲精品| 精品国产乱码久久久久久图片| heyzo中文字幕在线| 久精品国产欧美| 日韩经典一区二区| 国产一二三av| 日韩欧美国产一二三区| www.youjizz.com在线| 久中文字幕一区| 免费观看一级特黄欧美大片| 国产高潮流白浆| 精品久久久久久久久久久久包黑料| heyzo在线播放| 色噜噜狠狠色综合网| 激情欧美一区二区三区在线观看| 青草草在线视频| 日韩va亚洲va欧洲va国产| 成人一区福利| 欧美 另类 交| 99精品在线免费| 中文在线字幕av| 欧美激情久久久久| 九色精品91| 国产又粗又长又爽又黄的视频| 亚洲国产精品一区二区www在线| 欧洲亚洲精品视频| 成人久久久久爱| 日韩视频久久| 国产老头老太做爰视频| 精品国产乱码久久| 黄色精品视频| 日韩小视频网站| 国产人伦精品一区二区| 精品国产伦一区二区三| 日本精品性网站在线观看| 在线成人直播| 国产中年熟女高潮大集合| 91精品国产综合久久香蕉的特点| 精品众筹模特私拍视频| 日本最新一区二区三区视频观看| 国产精品性做久久久久久| 99re国产在线| 97在线视频免费看|