精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大語言模型(LLM)是如何思考的?講講推動下一代人工智能推理的五種途徑 原創(chuàng)

發(fā)布于 2025-4-8 08:14
瀏覽
0收藏

大語言模型(LLMs)最早時期只是具備自動完成的功能,迄今為止,進(jìn)步巨大,與當(dāng)初已經(jīng)不可同日而語。然而,僅僅是生成流暢的文本并不足以體現(xiàn)真正的智能——真正的智能是需要推理能力的。這意味著,大語言模型需要能夠解決數(shù)學(xué)問題、能夠調(diào)試代碼、能夠得出合乎邏輯的結(jié)論,還要能夠檢查和改正自身的錯誤。通常而言,現(xiàn)代大語言模型的訓(xùn)練目標(biāo)往往是預(yù)測下一個詞語是什么,而不是去思考。那么,它們是如何突然變得非常擅長推理的呢?

答案是一系列新技術(shù)使然——從提示工程到代理工具使用——這些技術(shù)推動著、指導(dǎo)著或在一定程度上直接促成著大語言模型日益成為有條不紊的思考者。下面,讓我們講講五種最具有影響力的策略,正是它們,推動著推理型大語言模型不斷邁向新的領(lǐng)域。

1.思維鏈提示:教大語言模型“逐步思考”

提高大型語言模型推理能力,起步最早且最能打的技術(shù)之一異乎尋常地簡單:讓模型解釋自身。

這種方法被稱為思維鏈(Chain-of-Thought,CoT)提示。意指提示模型在給出最終答案之前產(chǎn)生中間推理步驟。例如,不采用直接去問“17乘以24等于多少?”這種簡單直接的方式,而是用“讓我們一步一步地思考”來提示模型,引導(dǎo)它將問題分解為:17×24=(20×17)+(4×17),諸如此類,等等。

這一理念最早于2022年正式提出,至今仍然是基礎(chǔ)性的指導(dǎo)思想。OpenAI的o1模型就被訓(xùn)練為“在回答之前更多地思考”——其本質(zhì)就是內(nèi)化了類似CoT的推理鏈。它的繼任者o3則更進(jìn)一步,以模擬推理的方式,在推理過程中暫停,用以反思和完善自身響應(yīng)。

原理呢,則很簡單:通過強(qiáng)制實(shí)施中間步驟,避免模型草率地、跳躍式地一步得出結(jié)論,從而提升多步推理演繹能力。

2.推理時間計(jì)算擴(kuò)展:給每個問題更多的思考時間

如果一個問題難度很大,那就用更多的時間去思考——人類是會這么做的,現(xiàn)在大語言模型也可以。

推理時間計(jì)算擴(kuò)展,是指通過在生成過程中分配更多的計(jì)算這一途徑,來增強(qiáng)推理能力。模型可能會生成多個推理路徑,但最后會選出最佳路徑。這種“自洽性”方法已成為推理基準(zhǔn)的標(biāo)準(zhǔn)。

OpenAI的o3-mini定義了三種推理程度選項(xiàng)(低、中、高),這些選項(xiàng)決定了模型在回答問題之前內(nèi)部推理的時間長短。在高推理水平下,o3-mini在數(shù)學(xué)和編碼任務(wù)上??的表現(xiàn)甚至優(yōu)于??完整的o1模型。?

2025年的論文《s1:簡單測試時間擴(kuò)展》中引入了一種相關(guān)技術(shù),預(yù)算強(qiáng)制(budget forcing),它使用特殊標(biāo)記來控制推理深度。通過附加重復(fù)的“等待”標(biāo)記,引導(dǎo)模型生成更長的響應(yīng)、自我驗(yàn)證并自我糾正。使用類似“最終答案”這樣的結(jié)束思考信號標(biāo)記何時停止。這種方法在不修改模型權(quán)重的情況下擴(kuò)展推理,從而提高了準(zhǔn)確性——這是對經(jīng)典“逐步思考”提示的現(xiàn)代化升級和改造。

代價也是有的,那就是準(zhǔn)確性的延遲。但是如果是面對棘手或艱巨的任務(wù),這通常是值得的,并且是利大于弊的。

3.強(qiáng)化學(xué)習(xí)和多階段訓(xùn)練:優(yōu)秀推理予以獎勵

另一個改變游戲規(guī)則的因素:不要僅僅局限于預(yù)測單詞,而是要獎勵正確的推理。

OpenAI的o1和DeepSeek-R1這樣的模型是通過強(qiáng)化學(xué)習(xí)(RL)進(jìn)行訓(xùn)練的,以鼓勵優(yōu)秀的推理模式。這些模型不僅僅是模仿數(shù)據(jù),還能夠獎勵生成有邏輯多步答案的推理。DeepSeek-R1的第一個迭代版本R1-Zero僅僅是使用了RL——并沒有監(jiān)督微調(diào)——就開發(fā)出了非常強(qiáng)大的推理能力。

然而,僅僅使用強(qiáng)化學(xué)習(xí)(RL)訓(xùn)練有可能導(dǎo)致語言不穩(wěn)定的問題出現(xiàn)。所以最終DeepSeek-R1采用了多階段訓(xùn)練方法:先進(jìn)行強(qiáng)化學(xué)習(xí)推理,然后使用監(jiān)督微調(diào)來提高可讀性。同樣,阿里巴巴的QwQ-32B將強(qiáng)大的基礎(chǔ)模型和持續(xù)的強(qiáng)化學(xué)習(xí)擴(kuò)展相結(jié)合,在數(shù)學(xué)和代碼方面體現(xiàn)了出色的性能。

結(jié)果如何?這些模型不僅能夠給出正確的答案,還能展示出正確答案是如何得到的——甚至學(xué)會了自我糾正。

4.自我糾正和回溯:推理,然后倒帶

當(dāng)模型出錯時會發(fā)生什么情況?它自己能夠意識到并改正錯誤嗎?

一直以來,大語言模型都在努力進(jìn)行自我糾正,但這方面一直有問題存在。2023 年,研究人員??發(fā)現(xiàn)??,僅僅是簡單地讓模型“再試一次”,對答案鮮有改善——有時甚至?xí)骨闆r變得更糟。但2025年有了新的進(jìn)展,回溯——一種經(jīng)典AI策略,被引入到大語言模型中來。?

騰訊AI實(shí)驗(yàn)室的王姓工程師等人發(fā)現(xiàn),在o1型模型中存在“思考不足”的問題:模型會在不同的想法之間跳躍,而不是一直堅(jiān)持一條推理路線。他們的策略是對推理切換進(jìn)行懲罰,鼓勵對每個想法進(jìn)行深入探索。

與此同時,楊姓工程師等人提出了自回溯——當(dāng)模型陷入僵局時,讓其重新回放,然后探尋更好的替代方案。這一策略與只依賴最優(yōu)推理解決方案的策略相比,準(zhǔn)確率提高了超過四十個百分點(diǎn)。

這些創(chuàng)新有效地增加了推理時的搜索和規(guī)劃能力,呼應(yīng)了深度優(yōu)先搜索等傳統(tǒng)AI方法,并將它們疊加在大語言模型的靈活功能之上。

5.工具的使用以及外部知識的整合:超越模型的推理

有時候,推理意味著知道何時該去尋求幫助。

現(xiàn)代大語言模型越來越多地調(diào)用外部工具——計(jì)算器、代碼解釋器、各種API甚至網(wǎng)絡(luò)搜索——來處理復(fù)雜的查詢。

阿里巴巴的QwQ-32B直接集成了代理功能,使其能夠在推理過程中調(diào)用函數(shù)或訪問API。谷歌的Gemini 2.0(Flash Thinking)也支持類似的功能——例如,它可以在推理過程中啟用代碼執(zhí)行,允許模型在其推理過程中運(yùn)行和評估代碼。

這一點(diǎn)非常重要,原因在于某些任務(wù)——比如驗(yàn)證實(shí)時數(shù)據(jù)、執(zhí)行符號數(shù)學(xué)或執(zhí)行代碼——超出了模型內(nèi)部的能力。將這類子任務(wù)轉(zhuǎn)移出去,能夠讓大語言模型更專注于高階邏輯,從而顯著提高準(zhǔn)確性和可靠性。

從本質(zhì)上講,外部工具能夠讓大語言模型發(fā)揮超出其自身能耐的潛力——就像是一把數(shù)字瑞士軍刀,用精密儀器來擴(kuò)展推理能力。

結(jié)論:推理是一個堆棧,而不是一個開關(guān)

大語言模型并不是一蹴而就就能“學(xué)會推理”——它們是通過一系列分層的技術(shù)來獲取這種能力的。這些技術(shù)包括訓(xùn)練、提示、推理以及與外部世界的互動。思維鏈提示加強(qiáng)了結(jié)構(gòu),推理時間擴(kuò)展增加了深度,強(qiáng)化學(xué)習(xí)(RL)改善了對齊性,回溯增強(qiáng)了自我意識,外部工具使用增加了覆蓋面。

至于像OpenAI的o1和o3、DeepSeek的R1、谷歌的Gemini 2.0 Flash Thinking以及阿里巴巴的QwQ這樣的頂級模型,則結(jié)合了這些策略中的幾種——可以稱之為將巧妙設(shè)計(jì)與認(rèn)知支架融合在一起的混合方案。

隨著該領(lǐng)域的不斷發(fā)展,可以預(yù)見,內(nèi)部推理過程與外部決策工具之間的耦合將會更加緊密。逐步走近我們的,不是僅僅能夠猜測下一個單詞,而是還能夠真正思考的大語言模型。

譯者介紹

張哲剛,51CTO社區(qū)編輯,系統(tǒng)運(yùn)維工程師,國內(nèi)較早一批硬件評測及互聯(lián)網(wǎng)從業(yè)者,曾入職阿里巴巴。

原文標(biāo)題:??How Do LLMs Think? 5 Approaches Powering the Next Generation of AI Reasoning??,作者:Kate Koidan?


?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請注明出處,否則將追究法律責(zé)任
已于2025-4-8 09:33:19修改
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦
黄色av一区二区| 亚洲黄色小说视频| 白白色在线观看| 成人aa视频在线观看| 91超碰中文字幕久久精品| 91久久免费视频| 不卡的国产精品| 午夜在线电影亚洲一区| 日韩av影视| 最近中文字幕免费在线观看| 亚洲国产精品综合久久久| 精品成人一区二区三区四区| 国产精品免费观看久久| 免费网站成人| 久久婷婷一区二区三区| 91精品视频免费| 国产香蕉视频在线| 亚洲a一区二区三区| 亚洲精品久久久久中文字幕二区| 少妇黄色一级片| 麻豆av在线免费观看| 国产情人综合久久777777| 国产精品久久久久久久免费大片| 波多野结衣高清视频| 国产精品hd| 在线亚洲国产精品网| 91视频在线免费| 成人自拍视频| 91精品福利视频| 日韩欧美不卡在线| 美女国产在线| 国产亚洲一区二区三区| 国产精品 日韩| 国产精品久久无码一三区| 免费看的黄色欧美网站| 欧美激情一区二区三区成人| 国产免费嫩草影院| 奇米亚洲欧美| 亚洲精品久久视频| 曰本三级日本三级日本三级| 福利一区二区| 色狠狠色狠狠综合| 成人在线免费观看av| 国内在线免费视频| 亚洲精品乱码久久久久久日本蜜臀| 水蜜桃一区二区三区| 精品美女视频在线观看免费软件| 99免费精品在线观看| 亚洲xxx自由成熟| 一区二区三区日| 青青草国产精品97视觉盛宴| 欧洲午夜精品久久久| 国产无遮挡又黄又爽又色| 女主播福利一区| 久久国产精品偷| 欧美一级特黄高清视频| 色综合狠狠操| 日韩中文字幕久久| 我要看一级黄色录像| 欧美大片aaaa| 久久韩剧网电视剧| 日韩在线一卡二卡| 91精品国产视频| 久久久极品av| 在线免费日韩av| 韩日欧美一区| 国内精品模特av私拍在线观看| 成人欧美一区二区三区黑人一| 91综合在线| 久久亚洲精品毛片| 欧美黄色一区二区三区| 精品二区久久| 88国产精品欧美一区二区三区| a v视频在线观看| 午夜亚洲性色视频| 国产精品久久久久一区二区| 中文在线观看av| 激情图区综合网| 成人免费视频网站入口| 午夜视频在线播放| 国产日韩欧美精品一区| 尤物国产精品| 55av亚洲| 在线免费观看日本一区| 特黄视频免费观看| 卡通动漫精品一区二区三区| 亚洲欧美国产高清va在线播| 欧美极品jizzhd欧美18| 亚洲精品888| 国内偷自视频区视频综合| 欧美激情黑白配| 免费在线观看精品| 99视频免费观看| 免费资源在线观看| 日韩毛片一二三区| 国产极品尤物在线| 欧美成人家庭影院| 亚洲第一色在线| 舐め犯し波多野结衣在线观看| 久久久久国产| 欧美一区二区三区艳史| 91av久久久| 91在线精品秘密一区二区| 亚洲欧美久久久久一区二区三区| 青草视频在线免费直播 | 久久大片网站| 久草资源在线观看| 欧美日韩精品中文字幕| 免费av不卡在线| 天堂俺去俺来也www久久婷婷| 丝袜情趣国产精品| 国产情侣自拍av| 国产在线不卡一卡二卡三卡四卡| 久久资源av| 在线三级中文| 欧美天堂一区二区三区| 日本五十肥熟交尾| 91精品推荐| 国产ts人妖一区二区三区 | 中文字幕在线看片| 精品日韩在线一区| 日韩一卡二卡在线观看| 性色一区二区三区| 99蜜桃在线观看免费视频网站| 98在线视频| 91精品91久久久中77777| 亚洲一二三四五| 久久在线电影| 国产成人极品视频| 少妇av一区二区| 亚洲精品高清在线| 中文字幕国产高清| 日韩免费久久| 国产精品久久久久999| 全色精品综合影院| 婷婷久久综合九色综合伊人色| 国产一区二区在线观看免费视频| 国产日产精品_国产精品毛片| 国模视频一区二区| 欧美 日韩 人妻 高清 中文| 亚洲男同性恋视频| 天堂在线中文在线| 久久精品99久久无色码中文字幕| 国产精品99一区| 人人九九精品| 色狠狠色噜噜噜综合网| 亚洲综合色一区| 视频精品一区二区| 日本一区二区三区在线视频| 欧美二三四区| 亚洲精品永久免费精品| 国产香蕉视频在线| www激情久久| 国产91对白刺激露脸在线观看| 久久影院资源站| 欧美综合在线第二页| 亚洲色大成网站www| 精品日本高清在线播放| 极品粉嫩小仙女高潮喷水久久| 亚洲国产影院| 久久一区二区精品| 欧美日韩大片| 国产一区二区三区视频| 特级西西444www高清大视频| 国产精品久久久久久户外露出| 久热精品在线观看视频| 999国产精品视频| 91超碰rencao97精品| 欧美aaa免费| 亚洲成人久久电影| 国产 欧美 日韩 在线| 久久精品一二三| 黄大色黄女片18第一次| 在线电影一区二区| 国产精品av一区| 成人免费看视频网站| 在线观看久久久久久| 91精品视频免费在线观看 | 国产高清精品软男同| 精品国产第一国产综合精品| 欧美精品激情在线观看| 人成免费电影一二三区在线观看| 欧美日韩一级二级| 欧美精品videos极品| 91视频你懂的| 九九精品久久久| 国内精品久久久久国产盗摄免费观看完整版 | 免费在线看黄网址| 91视频.com| 91精产国品一二三产区别沈先生| 一区视频在线| 亚洲欧洲精品一区二区三区波多野1战4 | 日本欧美视频| av成人在线电影| 另类专区亚洲| 九九精品视频在线| 久青草国产在线| 欧美一卡在线观看| 久久久久在线视频| 一区二区不卡在线播放| 国产毛片久久久久久久| 国产精品亚洲专一区二区三区| 能在线观看的av| 午夜国产精品视频| 日韩精品欧美在线| 懂色av一区二区| 国产欧美日韩中文字幕在线| 国产在线88av| 欧美成人免费小视频| 国产三级在线看| 亚洲国产精品va在线| ,一级淫片a看免费| 91福利在线观看| 日本三级片在线观看| 国产精品美女www爽爽爽| 在线免费观看污视频| 国模无码大尺度一区二区三区| av网站在线观看不卡| 欧美午夜精品| 男女h黄动漫啪啪无遮挡软件| 激情五月综合| 精品视频一区二区三区四区| 51vv免费精品视频一区二区| 91精品国产综合久久男男| 成年美女黄网站色大片不卡| 欧美肥婆姓交大片| 免费a级人成a大片在线观看| 一个人www欧美| 日韩午夜影院| 日韩精品高清在线| 免费激情视频网站| 欧美电视剧在线看免费| 国产乱人乱偷精品视频| 欧美日韩一区二区三区四区 | 中文亚洲欧美| 精品人妻人人做人人爽| 911精品美国片911久久久| 图片区小说区区亚洲五月| 爽爽窝窝午夜精品一区二区| 国产视频不卡| 欧美激情15p| 国产在线播放一区二区| 懂色av一区二区| 国产一区免费在线| 国产一区二区在线视频你懂的| 国产精品xxxx| 国产精品国产| 国产日韩二区| 免费日韩一区二区三区 | 国产影视一区| 日韩久久不卡| 色乱码一区二区三区网站| 亚洲一区二区三区精品动漫| 93在线视频精品免费观看| 在线电影看在线一区二区三区| 日韩欧美不卡| 一级一片免费播放| 欧美va天堂在线| 国产日韩av网站| 亚洲主播在线| 国产成人av影视| 奇米亚洲午夜久久精品| 久久国产精品国产精品| 国产麻豆精品theporn| 女女调教被c哭捆绑喷水百合| 成人禁用看黄a在线| 久久福利小视频| 久久久久亚洲综合| 99自拍偷拍视频| 亚洲精品免费看| 精品视频在线观看免费| 狠狠躁18三区二区一区| 日韩av免费播放| 欧美一区二区三区在线看| 亚洲国产一二三区| 亚洲免费电影在线观看| 嫩草在线视频| 韩剧1988免费观看全集| 日本免费一区二区三区四区| 国产精品一区二区三区毛片淫片 | 国模一区二区三区私拍视频| 你懂的一区二区三区| 亚洲高清在线观看一区| 欧美xxx在线观看| 久久国产亚洲精品无码| 免费成人美女在线观看.| 一级黄色大片免费看| 91在线观看高清| 国产日产精品一区二区三区的介绍 | 日产国产精品精品a∨| 久久久久久久久国产一区| 日本一道本久久| 另类小说一区二区三区| 欧美夫妇交换xxx| 国产精品久久毛片| 日韩免费在线视频观看| 欧美日本视频在线| 神马一区二区三区| xvideos成人免费中文版| √最新版天堂资源网在线| 国产一区二区香蕉| 日韩激情网站| 欧美 亚洲 视频| 日韩高清不卡一区二区| 无码人妻一区二区三区精品视频| 国产日产欧美精品一区二区三区| 久草视频免费在线| 欧美三级三级三级| 亚洲欧洲综合在线| 欧美巨乳美女视频| 国产经典一区| 久久99国产精品| 国产综合自拍| 久久成年人网站| 国产欧美日韩在线| 国产情侣自拍av| 亚洲精品一区二区三区99| 巨大荫蒂视频欧美另类大| 日本免费久久高清视频| 99久久婷婷国产综合精品青牛牛| 亚洲午夜激情| 久久国产高清| yy6080午夜| 亚洲成人免费影院| 精品国产av一区二区三区| 色婷婷av一区二区三区在线观看| 亚洲最新无码中文字幕久久| 国产精品麻豆免费版| 欧美一区不卡| 五月天婷婷影视| 国产精品美女一区二区| 99久久久久久久久| 亚洲精品中文字幕女同| av漫画网站在线观看| 高清国产一区| 欧美在线亚洲综合一区| 91pony九色| 亚洲美女淫视频| 国产露脸国语对白在线| 久热爱精品视频线路一| 91视频亚洲| 久久久一二三四| 精品中文字幕一区二区小辣椒| 超碰人人人人人人人| 欧美无乱码久久久免费午夜一区| 岛国大片在线观看| 国产精品欧美风情| 久久国产亚洲| 黄色一级片免费播放| 亚洲人成7777| www.成人免费视频| 欧美大荫蒂xxx| 欧美91在线| 黄色片一级视频| 国产欧美综合在线| 夜夜骚av一区二区三区| 久久久国产精彩视频美女艺术照福利| 亚洲香蕉久久| 97av中文字幕| 成人动漫视频在线| 五月激情六月丁香| 国产一区二区日韩| 成人黄色91| 97干在线视频| 久久久精品国产免大香伊| 中文字幕乱码视频| 久久91亚洲精品中文字幕奶水| ady日本映画久久精品一区二区| 日韩日韩日韩日韩日韩| 久久久精品国产免费观看同学| 伊人网站在线观看| 欧美成人精品不卡视频在线观看| 97色成人综合网站| 国产a级一级片| 国产精品久久久久久久久免费相片 | 欧美精品久久久久久久久老牛影院| 国产视频一区二区| 国产在线精品一区二区三区| 丝袜美腿高跟呻吟高潮一区| 免费黄色国产视频| 亚洲成人教育av| 日本精品另类| 欧美人与动牲交xxxxbbbb| 99久久久久免费精品国产 | 卡一卡二国产精品| 久久97人妻无码一区二区三区| 日韩av在线电影网| 亚洲男人在线| av7777777| 亚洲同性gay激情无套| 无码国产色欲xxxx视频| 成人av在线网址| 国产精品试看| 婷婷伊人五月天| 亚洲欧洲日韩国产| 日本精品在线播放| 欧美精品无码一区二区三区| 一区二区三区中文字幕| 国产乱理伦片a级在线观看| 99视频免费观看|