精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大模型智能體如何突破規(guī)模化應(yīng)用瓶頸,核心在于Agentic ROI

人工智能 新聞
上海交通大學聯(lián)合中科大在本文中指出:現(xiàn)階段大模型智能體的主要障礙不在于模型能力不足,而在于其「Agentic ROI」尚未達到實用化門檻。

本文第一作者為上海交通大學計算機學院副教授劉衛(wèi)文,研究方向為大模型智能體,大語言模型,個性化算法等。

近年來,隨著大語言模型的快速發(fā)展,基于其構(gòu)建的大模型智能體(LLM Agents)正逐步從技術(shù)演示走向?qū)嶋H應(yīng)用部署。然而,真正實現(xiàn)規(guī)模化應(yīng)用仍面臨諸多瓶頸。使用范圍主要集中于專業(yè)領(lǐng)域,如代碼生成、科研輔助等。在大眾、高頻、日常的應(yīng)用場景(如電商、個人助理)中,普及率依然較低。這一現(xiàn)象引發(fā)了一個關(guān)鍵問題:

當前制約大模型智能體實際可用性的真正原因是什么?

上海交通大學聯(lián)合中科大在本文中指出:現(xiàn)階段大模型智能體的主要障礙不在于模型能力不足,而在于其「Agentic ROI」尚未達到實用化門檻。

圖片

Agentic ROI:大模型智能體實現(xiàn)規(guī)模化應(yīng)用的關(guān)鍵瓶頸

研究團隊提出 Agentic ROI(Agentic Return on Investment)這一核心指標,用于衡量一個大模型智能體在真實使用場景中所帶來的「信息收益」與其「使用成本」之間的比值:

圖片

  • Information Quality:指智能體所生成的信息質(zhì)量,包括準確性、完整性等。
  • Quality Threshold:指最低可接受的信息質(zhì)量閾值(注:根據(jù)上下文推斷)。
  • Human Time和 Agent Time:分別指人類與智能體完成對應(yīng)任務(wù)所需的時間。
  • Interaction Time:指用戶與智能體交互所需要的時間,如用戶進行任務(wù)描述、驗證結(jié)果過程中所消耗的時間。
  • Expense:指用戶經(jīng)濟成本,如模型調(diào)用、API 使用的開銷。

只有當信息質(zhì)量超過一定閾值,且智能體所節(jié)省的時間和成本之比足夠高時,智能體才真正具備可用性。

圖片

如上圖所示,當前大部分 LLM 智能體集中應(yīng)用于人類任務(wù)時間成本高的信息密集型場景(如科研、編程),此類任務(wù)本身就需要大量人力投入,因此即便智能體部分替代也能顯著提高效率。然而,在用戶量龐大的日常場景中(如電商、搜索、助理等),任務(wù)本身較為簡單,交互成本低(如點擊、下滑操作),智能體提升的邊際價值不明顯,反而可能引入額外的交互成本和延遲,從而導(dǎo)致 Agentic ROI 較低。

因此,當前高用戶需求與低 Agentic ROI 之間的矛盾,反映了智能體在日常應(yīng)用中的實用性不足,需進一步優(yōu)化信息價值、智能體任務(wù)完成時間、及交互時間以填補市場空白。

優(yōu)化 Agentic ROI 智能體發(fā)展的「之字形」軌跡

研究團隊提出,LLM 智能體的發(fā)展路徑并非線性增長,而是呈現(xiàn)出一種「先規(guī)模化、后輕量化」的「之字形」發(fā)展模式:首先規(guī)模化(scaling up)參數(shù)規(guī)模、訓練數(shù)據(jù)、推理能力以提升信息質(zhì)量;之后在保證信息質(zhì)量的前提下,輕量化(scaling down)進行模型壓縮、蒸餾、推理優(yōu)化以減少智能體所用時間與調(diào)用成本。我們正處于智能體規(guī)模化發(fā)展的高峰階段,優(yōu)先提升信息質(zhì)量。

基礎(chǔ)模型如 OpenAI 系列模型的發(fā)展也體現(xiàn)了這一「之字形」發(fā)展趨勢:同系列模型如 o1-mini 到 o1 模型表現(xiàn)顯著增強,而新一代小模型如 o3-mini 則在持平 o1 性能的同時顯著降低了推理費用和延遲。

圖片

規(guī)模化提升信息質(zhì)量(Scaling Up)

預(yù)訓練規(guī)模化(Pre-training Scaling)

 預(yù)訓練階段通過擴大模型規(guī)模、數(shù)據(jù)量和計算資源,使智能體在語言理解、推理和世界知識等基礎(chǔ)能力方面獲得穩(wěn)步提升。而規(guī)模化使用包含任務(wù)結(jié)構(gòu)和操作流程的文檔數(shù)據(jù)(如操作手冊、工作流程指南)能夠幫助模型學習實際任務(wù)的分解邏輯和執(zhí)行順序。此外,隨著上下文窗口的擴展和記憶機制的引入,智能體可以處理更長的交互歷史和用戶偏好,從而提升多輪任務(wù)執(zhí)行的能力。

后訓練規(guī)模化(Post-training Scaling)

 后訓練階段(如監(jiān)督微調(diào)和強化學習)使智能體更貼近人類的需求與價值觀。同時,智能體性能提升還依賴于大規(guī)模復(fù)雜環(huán)境(網(wǎng)頁、API 接口)交互軌跡數(shù)據(jù),使用外部工具進行操作決策。此外,在真實部署中積累的用戶反饋、任務(wù)完成記錄和錯誤修復(fù)數(shù)據(jù),構(gòu)成了智能體持續(xù)學習與演化的基礎(chǔ),形成智能體的數(shù)據(jù)飛輪,使其在真實使用中不斷優(yōu)化行為。

推理時規(guī)模化(Test-time Scaling)

 推理時規(guī)模化包括:

  • 規(guī)模化推理步驟(Scaling reasoning process),以應(yīng)對復(fù)雜任務(wù)并生成更可靠的輸出;
  • 規(guī)模化多智能體系統(tǒng)(Scaling multi-agent system),通過協(xié)作完成任務(wù)分解與執(zhí)行;
  • 擴展工具調(diào)用(Scaling tool calling),通過多次工具調(diào)用使智能體能夠逐步驗證中間結(jié)果;
  • 擴展推理時訓練(Scaling test-time training),通過利用無標簽測試數(shù)據(jù)實時更新快速適應(yīng)新任務(wù)或用戶需求
  • 有約束條件下直接優(yōu)化 Agentic ROI(Scaling towards Agentic ROI under budget constraints),智能體可在給定預(yù)算約束(如時間、API 成本)下動態(tài)評估每一步操作信息收益,直接整體優(yōu)化 Agentic ROI。

構(gòu)建世界模型(Building World Model)

 構(gòu)建真實的「世界模型」對于實現(xiàn)真正規(guī)模化數(shù)據(jù)合成、智能體評估至關(guān)重要。世界模型應(yīng)支持多模態(tài)交互(語言、圖像、文檔、音頻),具備處理多步驟、長時程任務(wù)的能力,并能模擬用戶的多樣化偏好與反饋機制。此外,它還應(yīng)反映現(xiàn)實世界中的不確定性,例如信息不完全、用戶意圖變化、環(huán)境干擾等。

確保魯棒性與安全性(Ensuring Robustness & Security)

 確保智能體行為的穩(wěn)健性與安全性也是提升信息質(zhì)量的重要一環(huán)。魯棒性方面,智能體應(yīng)防止獎勵機制被利用,避免出現(xiàn)「獎勵黑客」現(xiàn)象;安全性方面,需要防范訓練數(shù)據(jù)污染、防止反饋被篡改和后門攻擊等。在運行過程中,智能體應(yīng)配備異常檢測和事實核查能力,確保輸出內(nèi)容的準確性與一致性。同時,構(gòu)建行為審計機制和可解釋性工具,可以提升智能體的可控性和可靠性。

輕量化降低智能體時間與成本(Scaling Down)

減少智能體任務(wù)完成時間

引入記憶機制: 引入記憶機制是提高效率的重要手段。具備記憶能力的智能體可以跳過重復(fù)計算,直接調(diào)用以往任務(wù)中積累的知識,從而加快處理速度。這種方式模擬人類專家的行為,依靠經(jīng)驗而非實時推理來完成任務(wù)。模型壓縮: 通過模型壓縮或蒸餾來減少計算資源和推理延遲,是另一個核心方向。借助模型蒸餾等技術(shù),可以將大模型的能力遷移到更小的模型中,從而在不顯著降低性能的前提下,顯著縮短響應(yīng)時間、減少部署成本。

優(yōu)化推理策略: 智能體的時間消耗不僅來源于計算,還受到推理鏈條長度的影響。如果推理過程過于復(fù)雜或冗余,例如頻繁的自我反思、遞歸規(guī)劃等,可能會延長任務(wù)完成時間而未帶來質(zhì)的提升。因此,更高效的智能體應(yīng)具備「少而精」的思維能力,能夠通過最短路徑達成最優(yōu)解。

基礎(chǔ)設(shè)施優(yōu)化: 硬件層面的升級,如 Groq 和 Cerebras 等新型 AI 芯片,以及軟件層面的優(yōu)化,如 vLLM 和 FlashAttention 等推理引擎,都能顯著提升模型運行速度。只有軟硬件協(xié)同進化,才能真正滿足低延遲、實時響應(yīng)的實際需求,從而提升智能體的整體可用性。

降低成本

降低交互時間: 當前的智能體往往要求用戶提供冗長、明確的指令,這帶來了較高的使用門檻與認知負擔。為此,智能體的交互方式應(yīng)從被動解析輸入,轉(zhuǎn)向主動理解用戶意圖,具備一定程度的目標推理與任務(wù)自完成能力。這種轉(zhuǎn)變不僅可以減少用戶的操作負擔,也有助于提升整體使用體驗。此外,產(chǎn)品設(shè)計上的新范式也有助于進一步降低用戶交互時間。

降低開銷: 智能體的運行費用可能因模型規(guī)模、推理深度、調(diào)用外部工具等因素而迅速上升。尤其在大規(guī)模部署或持續(xù)運行場景下,成本問題尤為突出。因此,未來的智能體需要更智能地管理上下文,合理控制推理復(fù)雜度與工具調(diào)用頻率,確保在保證性能的前提下,盡可能降低資源消耗與使用開銷。

Agentic ROI 提供了一個衡量智能體真實可用性的系統(tǒng)框架,幫助我們超越模型性能的單一維度,轉(zhuǎn)向「實際效益」導(dǎo)向的設(shè)計與評價邏輯。智能體的「可用性」不應(yīng)僅以模型性能定義,而應(yīng)以綜合效益衡量。在實際部署中,Agentic ROI 為我們提供了一個更貼近真實世界的評價維度,幫助我們識別系統(tǒng)中被忽視的「隱藏成本」,并指導(dǎo)我們構(gòu)建真正高效、可用、可負擔的智能體系統(tǒng)。


責任編輯:張燕妮 來源: 機器之心
相關(guān)推薦

2025-06-30 07:07:00

智能體大型語言模型LLM

2022-01-06 22:29:35

人工智能機器人自動化

2024-03-06 09:00:00

大語言模型人工智能

2025-05-07 16:27:23

2025-01-08 07:02:00

人工智能GenAI美妝領(lǐng)域

2012-08-29 14:35:17

2025-11-04 02:22:00

AgenticAI多智能

2022-11-10 08:02:08

2022-02-11 10:16:53

5G通信數(shù)字化轉(zhuǎn)型

2020-12-22 16:10:43

人工智能

2025-09-24 09:10:24

2023-09-25 07:31:19

算力AI框架

2025-11-06 01:44:00

2010-01-12 10:14:05

龍芯
點贊
收藏

51CTO技術(shù)棧公眾號

麻豆精品蜜桃| 免费成人在线看| 爽成人777777婷婷| 日韩视频免费观看高清在线视频| 老司机午夜免费福利视频| 人人妻人人玩人人澡人人爽| 久久久久一区| 久久综合五月天| 性欧美成人播放77777| 456成人影院在线观看| 成人免费在线视频观看| 久久大片网站| 国产露脸91国语对白| 一本久道久久久| 久久婷婷国产麻豆91天堂| 亚洲第九十七页| 日韩精品一区国产| 欧美在线短视频| 国产欧美日韩网站| 麻豆传媒视频在线观看| av中文字幕一区| 成人精品福利视频| 日本特级黄色片| 亚洲网色网站| 在线观看欧美www| 国产精品无码一区二区三| 视频欧美精品| 欧美在线综合视频| 成人午夜精品久久久久久久蜜臀| 日本中文在线| 日本一区二区成人| 美女亚洲精品| 天天干天天操av| 国产91精品久久久久久久网曝门| 国产精品日韩在线播放| 自拍偷拍欧美亚洲| 国产一区二区三区四区老人| 在线播放日韩av| 极品人妻一区二区三区| 久久免费福利| 5月丁香婷婷综合| 波多结衣在线观看| 姬川优奈av一区二区在线电影| 亚洲国产你懂的| 黄色片免费在线观看视频| 日本在线观看www| 日本一区二区成人| 亚洲a∨一区二区三区| 精品无人乱码| 国产午夜亚洲精品不卡| 茄子视频成人在线观看 | 韩国美女久久| 日韩欧美国产一区二区| 国产精品333| 色偷偷色偷偷色偷偷在线视频| 亚洲国产日产av| www.夜夜爱| 国产美女情趣调教h一区二区| 亚洲男人的天堂在线aⅴ视频| 国产a级片免费看| 超碰免费公开在线| 亚洲综合网站在线观看| 17c丨国产丨精品视频| sis001亚洲原创区| 色综合欧美在线视频区| 国产一线二线三线在线观看| 91国拍精品国产粉嫩亚洲一区 | 国产成人麻豆精品午夜在线| 国内精品久久久久影院一蜜桃| 成人激情视频在线播放| www.亚洲欧美| 91麻豆文化传媒在线观看| 欧美一进一出视频| 午夜视频在线免费观看| 亚洲欧美韩国综合色| 欧美乱做爰xxxⅹ久久久| 欧美亚洲日本精品| 91高清视频免费看| 91网址在线观看精品| 999国产精品一区| 日韩精品免费在线播放| 欧美做受高潮6| 五月天激情综合网| 久久久视频在线| 无码人妻丰满熟妇奶水区码| 欧美96一区二区免费视频| 成人综合国产精品| 熟妇高潮一区二区高潮| 中文字幕第一区综合| www.黄色网址.com| 日本不卡免费高清视频在线| 欧美在线观看一区二区| 人妻体体内射精一区二区| 久久综合另类图片小说| 一区二区成人精品| 久久国产在线观看| 视频在线观看一区| 99久久精品免费看国产四区| 色综合久久网女同蕾丝边| 国产精品成人网| 777777av| 国产精品亚洲四区在线观看| 亚洲国产小视频在线观看| 日本人亚洲人jjzzjjz| 欧美粗暴jizz性欧美20| 欧美性受xxxx白人性爽| 国产日韩欧美视频在线观看| 26uuu欧美| 日韩中文字幕亚洲精品欧美| 高清av不卡| 欧美sm美女调教| 欧美色图17p| 亚洲自啪免费| 99在线观看视频网站| 国产三级在线免费| 午夜国产精品影院在线观看| 成年人三级黄色片| 免费av一区二区三区四区| 欧美日本啪啪无遮挡网站| 中文字幕日本视频| 91香蕉视频污| 欧美高清中文字幕| 欧美精品三级在线| 日韩在线观看成人| 日本a级c片免费看三区| av一二三不卡影片| 日韩 欧美 视频| 国产午夜亚洲精品一级在线| 尤物精品国产第一福利三区 | 欧美视频日韩视频| 国产精品久久无码| 黄色精品网站| 亚洲综合日韩在线| 免费高清完整在线观看| 欧美日韩一区国产| 中文字幕在线观看免费高清| 性欧美精品高清| 黑人另类av| а√天堂8资源在线| 日韩你懂的在线观看| 国产免费美女视频| 美女国产一区二区三区| 午夜精品一区二区在线观看的| 亚洲精品福利电影| 精品无人区乱码1区2区3区在线 | 日韩一区二区a片免费观看| 一区二区日韩免费看| 国产精品露出视频| 免费在线看污片| 欧美r级电影在线观看| 欧美精品一区二区蜜桃| 国产不卡高清在线观看视频| 日本高清xxxx| 亚洲一级大片| 久久久久久中文字幕| 亚洲第九十九页| 亚洲国产另类av| 欧美在线一级片| 国产精品女主播一区二区三区| 久久国产一区二区| 蜜桃精品在线| 中文字幕亚洲一区在线观看 | 亚洲精品视频免费| 人妻 日韩精品 中文字幕| 久久精品无码一区二区三区| 久久九九国产视频| 久久麻豆精品| 亚洲精品免费网站| tube8在线hd| 亚洲人成77777在线观看网| 欧美 亚洲 另类 激情 另类| 国产精品高潮久久久久无| 红桃视频一区二区三区免费| 国内精品美女在线观看| 鲁丝片一区二区三区| 69堂免费精品视频在线播放| 色99之美女主播在线视频| 国产视频在线观看免费| 午夜欧美一区二区三区在线播放| 国产精品扒开腿做爽爽| 美女一区二区久久| 国产欧美久久久久| 国产成人影院| 51精品国产人成在线观看| 国产不卡人人| 色偷偷偷亚洲综合网另类| 亚洲精品国产手机| 日本高清无吗v一区| 精品无码久久久久成人漫画| av中文字幕不卡| 午夜精品免费看| 国产情侣久久| 超碰在线免费观看97| 欧美激情15p| 国产在线视频欧美| 大菠萝精品导航| 久久精品亚洲一区| 亚洲人在线观看视频| 欧美日韩免费在线视频| 日本网站在线播放| 国产精品久久一卡二卡| 影音先锋黄色资源| 国产一区二区不卡在线| 欧美黄色一级片视频| 欧美涩涩网站| 亚洲看片网站| 亚洲小说图片视频| www.久久草| 日韩电影精品| 国产97色在线|日韩| 91jq激情在线观看| 久久久国产视频| 久蕉在线视频| 日韩av一区二区在线观看| 国产aⅴ爽av久久久久成人| 欧美性生活影院| 久久久久久少妇| 亚洲国产成人av好男人在线观看| 蜜桃av免费在线观看| 久久久蜜桃精品| 中文字幕天堂av| 国产激情一区二区三区| 欧美一级特黄a| 日精品一区二区三区| 夜夜添无码一区二区三区| 羞羞答答成人影院www| 欧美综合77777色婷婷| 欧美高清视频看片在线观看| 成人激情直播| 麻豆精品国产| 91日本视频在线| 欧美91在线|欧美| 国产精品免费久久久久久| 一个人看的www视频在线免费观看 一个人www视频在线免费观看 | 亚洲成a人片综合在线| 老湿机69福利| 综合久久给合久久狠狠狠97色 | 亚洲午夜影视影院在线观看| 91视频青青草| 亚洲欧洲精品一区二区精品久久久| 欧洲美一区二区三区亚洲| 久久综合五月天婷婷伊人| 国产美女视频免费观看下载软件| 国产v综合v亚洲欧| 妖精视频在线观看| 国产成人三级在线观看| 国产黄色一区二区三区| 国内成+人亚洲+欧美+综合在线 | 成人网在线播放| 日批视频免费看| 成人v精品蜜桃久久一区| 国产香蕉精品视频| zzijzzij亚洲日本少妇熟睡| yjizz视频| 91香蕉视频mp4| 真人bbbbbbbbb毛片| 久久蜜臀中文字幕| 欧美 日韩 成人| 国产精品久久毛片a| 91香蕉一区二区三区在线观看| 18成人在线观看| 久久久久亚洲av无码专区 | 美女视频免费精品| 免费亚洲精品视频| 国产精品视频一区二区三区四蜜臂| 欧美另类一区| 久久一区二区三区电影| 国产免费一区二区三区四在线播放| 中文字幕av亚洲精品一部二部| 777久久精品一区二区三区无码 | 国产传媒免费观看| 国产成人免费视频一区| 国产毛片毛片毛片毛片毛片毛片| 久久伊人蜜桃av一区二区| 在线不卡av电影| 亚洲欧洲在线观看av| 免费一级黄色大片| 欧美午夜精品伦理| 中文字幕一区二区三区四区免费看 | 国产精品福利影院| 欧美激情一区二区视频| 疯狂做受xxxx高潮欧美日本| 波多野结衣影片| 日韩一区和二区| 欧洲天堂在线观看| 久久久成人精品视频| 国产中文在线播放| 国产精品一区二区三区久久| 日韩最新av| 色噜噜一区二区| 国产精品多人| 国产又大又黄又猛| av一区二区三区在线| 日韩精品123区| 欧美丝袜美女中出在线| 国产伦精品一区二区三区免.费| 亚洲国内精品视频| 在线观看av黄网站永久| 国内精品一区二区三区| 久久av日韩| 欧美12av| 在线日韩视频| 九九热视频免费| 国产三级精品视频| 91精品国产乱码在线观看| 欧美剧情片在线观看| 日本私人网站在线观看| 久久福利网址导航| 91精品国产66| 欧美久久在线| 国产欧美丝祙| 性猛交╳xxx乱大交| 亚洲欧洲www| 国产情侣小视频| 日韩精品一二三四区| 日本中文字幕中出在线| 国产精品网红直播| 国产精品一在线观看| 中文字幕人妻熟女人妻洋洋| 久久国产剧场电影| 在线免费观看视频| 色综合色狠狠天天综合色| 少妇精品高潮欲妇又嫩中文字幕| 久久亚洲影音av资源网| 国产亚洲精彩久久| 日本不卡一区二区三区视频| av成人毛片| 日韩aaaaa| 亚洲va国产va欧美va观看| 国产高清视频免费| 久久久av电影| 婷婷成人av| 在线免费观看一区二区三区| 青青草精品视频| 蜜桃传媒一区二区亚洲| 岛国av一区二区三区| 日韩在线视频第一页| 久久久久久久久久av| 亚洲无线观看| 久久成人福利视频| 成人午夜在线播放| 精品少妇爆乳无码av无码专区| 日韩一区二区在线观看| av在线看片| 成人片在线免费看| 国产一区美女| 国产人妻黑人一区二区三区| 亚洲一区欧美一区| 可以免费观看的毛片| 久久久久久久电影一区| 北条麻妃一区二区三区在线观看| 妺妺窝人体色www看人体| 国产99久久久国产精品免费看 | 91在线播放视频| 午夜日本精品| 日韩少妇一区二区| 欧美日韩国产在线看| 久久精品a一级国产免视看成人| 国产精品久久久久久久av大片| 成人一二三区| 天堂在线一区二区三区| 亚洲精品高清在线观看| 粉嫩小泬无遮挡久久久久久| 97在线观看免费| 欧美日韩爱爱| 国产探花在线看| 亚洲国产日日夜夜| 四虎精品成人免费网站| 2019亚洲日韩新视频| 精品国产一区二区三区| 亚洲精品手机在线观看| 亚洲男同性恋视频| 日韩一级片免费| 日本免费久久高清视频| 日韩大片在线播放| 特黄特色免费视频| 日韩欧美精品网站| 蜜芽在线免费观看| 国产精品一区二区三区在线观| 亚洲一区二区免费看| 国产又黄又粗又猛又爽的| 日韩欧美一区在线| 制服丝袜专区在线| 综合久久国产| 91啪亚洲精品| 国产精品污视频| 8090成年在线看片午夜| 日韩中文在线电影| 亚洲国产精品第一页| 欧美亚洲一区二区在线观看| 成人黄色网址| 欧洲视频一区二区三区| 国产不卡高清在线观看视频| 久久精品视频2| 欧美国产日韩一区二区三区| 国产乱码精品一区二区三区四区| 亚洲三级在线视频| 色8久久人人97超碰香蕉987| 4438x成人网全国最大| 任我爽在线视频精品一|