精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

模型調優無需標注數據!將Llama 3.3 70B直接提升到GPT-4o水平

人工智能 新聞
最近,AI 公司 Databricks 推出了一種新的調優方法 TAO,只需要輸入數據,無需標注數據即可完成。

現階段,微調大型語言模型(LLMs)的難點在于,人們通常沒有高質量的標注數據。

最近,AI 公司 Databricks 推出了一種新的調優方法 TAO,只需要輸入數據,無需標注數據即可完成。更令人驚喜的是,TAO 在性能上甚至超過了基于標注數據的監督微調。

圖片

眾所周知,LLM 很難適應新的企業級任務。提示(prompting)的方式容易出錯,且質量提升有限,而微調(fine-tuning)則需要大量的標注數據,而這些數據在大多數企業任務中是不可用的。

Databricks 提出的模型調優方法,只需要未標注數據,企業就可以利用現有的數據來提升 AI 的質量并降低成本。

TAO(全稱 Test-time Adaptive Optimization)利用測試時計算(由 o1 和 R1 推廣)和強化學習(RL)算法,僅基于過去的輸入示例來教導模型更好地完成任務。

至關重要的是,盡管 TAO 使用了測試時計算,但它將其作為訓練模型過程的一部分;然后,該模型以較低的推理成本(即在推理時不需要額外的計算)直接執行任務。

更令人驚訝的是,即使沒有標注數據,TAO 也能實現比傳統調優模型更好的質量,并且它可以將像 Llama 這樣的開源模型提升到與專有模型(如 GPT-4o 和 o3-mini)相當的質量水平。

借助 TAO,Databricks 已經取得了三項突破性成果:

  • 在文檔問答和 SQL 生成等專業企業任務中,TAO 的表現優于需要數千標注樣本的傳統微調方法。它讓 Llama 8B/70B 等高效開源模型達到了 GPT-4o/o3-mini1 等商業模型的同等水平,且無需任何標注數據;
  • 在零標注數據條件下,TAO 將 Llama 3.3 70B 模型在企業綜合基準測試中的表現提升了 2.4%;
  • 增加 TAO 訓練階段的算力投入,可以在相同數據條件下獲得更優模型質量,且不會增加推理階段的成本消耗。

圖 1 展示了 TAO 在三個企業級任務中對 Llama 模型的提升效果:盡管僅使用原始輸入數據,TAO 不僅超越了需要數千標注樣本的傳統微調 (FT) 方法,更讓 Llama 系列模型達到了商業模型的性能水準。

圖片

圖片

圖 1:Llama 3.1 8B 與 Llama 3.3 70B 在三大企業級基準測試中應用 TAO 的效果對比。TAO 帶來顯著的性能提升,不僅超越傳統微調方法,更直指高價商業大語言模型的性能水平

TAO 工作原理

基于測試時計算與強化學習的模型調優

TAO 的核心創新在于摒棄了人工標注數據,轉而利用測試時計算引導模型探索任務的可能響應,再通過強化學習根據響應評估結果更新模型參數。

該流程通過可擴展的測試時計算(而非昂貴的人工標注)實現質量提升,并能靈活融入領域知識(如定制規則)。令人驚訝的是,在高質量開源模型上應用該方法時,其效果往往優于依賴人工標注的傳統方案。

圖片

TAO pipeline

TAO 包含四個核心階段:

  • 響應生成:該階段首先收集任務相關的輸入提示或查詢樣本。在 Databricks 平臺上,這些提示可通過 AI Gateway 自動采集;
  • 響應評分:系統化評估生成響應的階段。評分方法包含多種策略,例如基于獎勵模型、偏好評分,或利用 LLM 評判器及定制規則進行任務特異性驗證,確保每個響應都做到最優;
  • 強化學習(RL)訓練:最終階段采用基于強化學習的方法更新大語言模型,引導模型生成與高分響應高度契合的輸出。通過這一自適應學習過程,模型持續優化預測能力以提升質量;
  • 持續改進:TAO 僅需 LLM 輸入樣本作為數據源。用戶與 LLM 的日常交互自然形成該數據 —— 一旦模型部署使用,即可自動生成下一輪 TAO 訓練數據。在 Databricks 平臺上,借助 TAO 機制,模型會隨著使用頻次增加而持續進化。

雖然 TAO 在訓練階段使用了測試時計算,但最終產出的模型在執行任務時仍保持低推理成本。這意味著經過 TAO 調優的模型在推理階段 —— 與原版模型相比 —— 具有完全相同的計算開銷和響應速度,顯著優于 o1、o3 和 R1 等依賴測試時計算的模型。實驗表明:采用 TAO 訓練的高效開源模型,在質量上足以比肩頂尖的商業閉源模型。

TAO 為 AI 模型調優提供了一種突破性方法:

  • 不同于耗時且易出錯的提示工程;
  • 也區別于需要昂貴人工標注數據的傳統微調;
  • TAO 僅需工程師提供任務相關的典型輸入樣本,即可實現卓越性能。

圖片

LLM 不同調優方法比較

實驗及結果

接下來,文章深入探討了如何使用 TAO 針對專門的企業任務調優 LLM。本文選擇了三個具有代表性的基準。

圖片

表 2:該研究使用的基準測試概覽

如表 3 所示,在所有三個基準測試和兩種 Llama 模型中,TAO 顯著提升了基礎 Llama 的性能,甚至超過了微調的效果。

圖片

表 3:在三個企業級基準測試中使用 TAO 的 Llama 3.1 8B 和 Llama 3.3 70B 實驗結果

與經典的測試時計算類似,當 TAO 能夠使用更多的計算資源時,它會產生更高質量的結果(見圖 3 中的示例)。然而,與測試時計算不同的是,這種額外的計算資源僅在調優階段使用;最終的語言模型的推理成本與原始語言模型相同。例如,o3-mini 生成的輸出 token 數量比其他模型多 5-10 倍,因此其推理成本也相應更高,而 TAO 的推理成本與原始 Llama 模型相同。

圖片

利用 TAO 提高模型多任務性能

到目前為止,該研究已經使用 TAO 來提升語言模型在單一任務(例如 SQL 生成)上的表現。接下來,該研究展示了 TAO 如何廣泛提升模型在一系列企業任務中的性能。

結果如下,TAO 顯著提升了兩個模型的性能,將 Llama 3.3 70B 和 Llama 3.1 70B 分別提升了 2.4 和 4.0 個百分點。TAO 使 Llama 3.3 70B 在企業級任務上的表現顯著接近 GPT-4o,所有這些改進都沒有產生人工標注成本。

圖片


責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-05-30 12:50:05

2023-07-21 12:51:32

2024-10-17 13:30:00

2020-12-09 22:15:40

物聯網IOT客戶關系

2024-05-17 17:25:44

2023-04-11 16:28:31

人工智能AI

2025-04-08 02:26:00

2024-08-26 10:00:00

模型數據

2016-07-19 09:35:34

云計算

2023-11-27 15:41:16

物聯網數字孿生

2024-08-15 15:45:00

AI訓練

2024-12-13 14:03:44

模型訓練AI

2024-06-05 08:33:29

2024-09-14 09:31:00

2024-04-30 08:28:44

開源大模型Llama

2021-05-28 11:02:11

VR

2025-03-12 10:38:05

2025-08-07 14:05:40

OpenAI大模型開源

2024-05-21 12:23:17

2024-06-05 08:29:35

點贊
收藏

51CTO技術棧公眾號

亚洲AV无码一区二区三区性| 午夜影院免费版| 飘雪影视在线观看免费观看| 久久黄色网页| 精品久久久av| 艳妇乳肉亭妇荡乳av| 综合在线影院| 亚洲激情网站免费观看| 国产区一区二区| 亚洲黄网在线观看| 一级欧洲+日本+国产| 亚洲国产精品女人久久久| 男人女人黄一级| 日本在线视频www鲁啊鲁| 99re视频精品| 91久久久精品| 69视频免费看| 黄色欧美日韩| 日韩视频免费在线观看| 污片免费在线观看| 亚洲欧美久久精品| 日韩欧美在线播放| 国产三级精品视频| 欧美一区二三区| 影音先锋男人看片资源| 久久国产精品色av免费看| 欧美视频一区二区三区| 三上悠亚久久精品| 国产精品va在线观看视色| 久久综合网色—综合色88| 成人午夜两性视频| 日韩三级一区二区| 亚洲国产导航| 久久综合久中文字幕青草| 国产麻豆天美果冻无码视频| 精品一区二区三区四区五区| 欧洲精品在线观看| 国产免费一区二区三区视频| 牛牛精品在线| 亚洲伦理在线精品| 中文字幕一区二区三区有限公司| 国产在线资源| 97aⅴ精品视频一二三区| 亚洲自拍中文字幕| 国产一区二区在线视频观看| 日本中文字幕不卡| 国产精品高精视频免费| 亚洲 欧美 视频| 亚洲黄色成人| 久久久久久久一区二区| 麻豆91精品91久久久| 亚洲视频在线免费| 久久综合伊人77777| av在线播放中文字幕| 国产亚洲电影| 亚洲午夜av电影| 亚洲精品成人无码熟妇在线| 久久资源综合| 亚洲国产欧美精品| 一女三黑人理论片在线| 久久人人爽人人爽人人片av不| 精品国产3级a| 免费a v网站| 亚洲另类av| 亚洲欧美日韩精品久久亚洲区 | jizz在线观看视频| 久久久精品国产免大香伊 | 精品毛片免费观看| 国产一区二区三区免费视频| 在线观看亚洲大片短视频| 加勒比久久综合| 中文字幕日韩免费视频| 亚洲女人久久久| 在线国产一区| 韩国一区二区电影| 黄色在线免费观看| 麻豆91精品视频| 亚洲一区二区久久久久久久| www.黄色av| 99久久婷婷国产综合精品| 蜜桃传媒视频麻豆一区 | 久久91精品国产91久久跳| 国产黄色的视频| 精品成人免费| 日韩av片免费在线观看| 91女人18毛片水多国产| 国产麻豆视频一区二区| 国产精品国产三级国产专区53| 人妻无码中文字幕| 国产午夜亚洲精品理论片色戒 | 精品国产精品三级精品av网址| www.中文字幕在线| 丰满少妇一区| 精品黑人一区二区三区久久 | 2020国产精品极品色在线观看| 日韩风俗一区 二区| 五月天精品在线| 天天综合亚洲| 欧美野外猛男的大粗鳮| 一区二区三区精| jlzzjlzz亚洲日本少妇| 亚洲欧美久久久久一区二区三区| 日本h片在线观看| 色婷婷av一区二区三区大白胸| 日韩三级电影网址| 三上悠亚 电影| 免费精品国产| 九九热精品在线| 国产免费一级视频| 成人午夜伦理影院| 亚洲国产精品www| 丁香花在线电影| 精品1区2区3区| 国产精品第七页| 中文精品久久| 国产精品久久久久久久久久东京 | 少妇视频一区二区| 一本一道久久综合狠狠老精东影业| 国产精品高精视频免费| 四虎在线视频免费观看| 亚洲欧洲综合另类在线| 波多野结衣家庭教师视频| 免费观看亚洲天堂| 中文字幕久久久| 狠狠人妻久久久久久| 国产91精品露脸国语对白| 一本一道久久a久久精品综合 | 中文字幕 欧美 日韩| 国产99久久精品一区二区300| 欧美日韩高清在线观看| 国产精品一级视频| 国产精品久久久久影院色老大| 国产肥臀一区二区福利视频| 爱高潮www亚洲精品| 精品国产一区二区三区在线观看 | 欧美日韩电影一区| 亚洲久久久久久久| 国产日韩欧美一区在线| 国产日韩精品久久| 成人免费一区二区三区牛牛| 欧美一级在线免费| 精品国产国产综合精品| 另类欧美日韩国产在线| 日韩影视精品| 亚洲第一二三四区| 国产成人在线视频网址| 久热精品视频在线| 日韩人妻精品中文字幕| 99久久久国产精品| 日本手机在线视频| 青青久久av| 国产91精品久久久久| 手机av免费在线观看| 亚洲一卡二卡三卡四卡五卡| 中文字幕18页| 国产欧美精品久久| 欧美日韩在线一区二区三区| 欧美国产大片| 中文欧美日本在线资源| 中文字幕无码乱码人妻日韩精品| 国产欧美精品一区二区三区四区 | 精品国产国产综合精品| 国产一区二区三区在线观看免费 | www.亚洲免费| 精品视频123区在线观看| 亚洲区一区二区三| 国产传媒日韩欧美成人| 亚洲精品久久久久久久蜜桃臀| 国产香蕉精品| 青青草精品毛片| 超碰在线影院| 51午夜精品国产| 久草网视频在线观看| 成人av在线一区二区三区| 波多野结衣乳巨码无在线| 视频一区在线观看| 91久久综合亚洲鲁鲁五月天| 国产美女一区视频| 亚洲欧美成人在线| 一区二区日韩在线观看| 亚洲一区二区三区四区在线| 日韩av一二区| 久久99久久99小草精品免视看| 久久久久久久久网| 亚洲aaa级| 国产欧美一区二区白浆黑人| 18视频在线观看网站| 亚洲精品视频在线播放| 91成人在线免费| 小视频免费在线观看| 亚洲国产精彩中文乱码av在线播放| 国产高潮久久久| 国产精品久久久久一区二区三区 | 无码人妻aⅴ一区二区三区日本| 伊人久久大香线蕉av超碰| 欧洲成人午夜免费大片| 欧美一区二区三区| 亚洲精品美女久久| 国产精品久久久久久久免费看| 午夜不卡av免费| 午夜精品一区二区三区视频| 久久综合色天天久久综合图片| www.精品在线| 亚洲主播在线| 美女av免费观看| 禁果av一区二区三区| 福利视频一区二区三区| 黄色欧美视频| 欧美孕妇性xx| 美女网站视频在线| 色综合伊人色综合网| 天天射天天色天天干| 日韩一区二区影院| 欧美一级黄视频| 精品magnet| 精品99久久久久成人网站免费 | 久久久av水蜜桃| 国产一区二区三区视频在线| 国产成人精品网站| 高清毛片在线观看| 欧美成人亚洲成人| 欧美激情免费| 在线播放国产一区二区三区| 天天色天天操天天射| 91精品国产黑色紧身裤美女| 波多野结衣视频网址| 同产精品九九九| 久久久综合久久久| 亚洲精品中文字幕在线观看| 欧美老女人性生活视频| 久久久久久久网| 免费a在线观看播放| 国产成人午夜精品影院观看视频| www.久久91| 麻豆视频一区二区| 国产免费人做人爱午夜视频| 亚洲毛片播放| 国产免费黄色小视频| **欧美日韩在线观看| 亚洲精品视频免费看| 国产又爽又黄无码无遮挡在线观看| 懂色一区二区三区免费观看| 丰满少妇中文字幕| 国产精品亚洲综合一区在线观看| 亚洲xxx在线观看| 捆绑调教美女网站视频一区| 午夜在线观看av| 日本在线播放一区二区三区| 久久国产色av免费观看| 久久婷婷激情| 一本色道无码道dvd在线观看| 另类天堂av| 丁香婷婷激情网| 日本欧洲一区二区| www.se五月| 国产美女精品一区二区三区| 肉色超薄丝袜脚交| 韩国成人精品a∨在线观看| 最新av免费在线观看| 精品亚洲成av人在线观看| 久热在线视频观看| 国产精品1区二区.| youjizz.com日本| 91丝袜美腿高跟国产极品老师| av无码av天天av天天爽| 久久久久国产成人精品亚洲午夜| 亚洲av无码国产精品麻豆天美| 国产欧美日韩久久| 久久精品日韩无码| 亚洲精品国产第一综合99久久 | 婷婷亚洲久悠悠色悠在线播放| 国产成人无码精品亚洲| 日韩欧美在线看| 中文字幕乱码人妻二区三区| 制服丝袜国产精品| 亚洲欧美激情在线观看| 日韩成人av网址| 大胆av不用播放器在线播放| 精品国产一区二区在线| 国产精品探花在线| 97视频免费观看| 黑人巨大精品欧美一区二区桃花岛| 国产精品旅馆在线| 一区二区亚洲视频| 欧美一级二级三级| 亚洲国产精品久久久天堂| 婷婷无套内射影院| 免费成人美女在线观看| 欧美xxxx日本和非洲| 久久蜜桃一区二区| 国产成人自拍网站| 欧美性感美女h网站在线观看免费| www.久久视频| 日韩欧美的一区| 成人亚洲综合天堂| 欧美精品在线免费观看| 成人免费看视频网站| 日韩欧美高清视频| 日本三级片在线观看| 欧美伊人久久久久久午夜久久久久| 国产精品久久久久久久免费| 亚洲精品在线看| 污污网站在线看| 国产精品国模在线| 操欧美女人视频| 亚洲一区精品视频| 亚洲一区二区毛片| 香蕉视频xxxx| 国产目拍亚洲精品99久久精品| 久久久久久免费观看| 欧洲一区二区三区免费视频| 国 产 黄 色 大 片| 中文字幕亚洲欧美日韩高清| aa国产成人| 91啪国产在线| 久久不见久久见国语| 欧美这里只有精品| 久久精品国产精品亚洲红杏 | 国产欧美日韩精品a在线观看| 久久国产免费观看| 欧美挠脚心视频网站| 视频福利在线| 欧美俄罗斯性视频| 成人在线视频国产| 日韩欧美亚洲v片| 国产精品一区毛片| xxxwww国产| 亚洲精品中文字幕在线观看| 中文字幕制服诱惑| 亚洲欧洲视频在线| 成人av观看| 精品一卡二卡三卡四卡日本乱码| 欧美精品自拍| 欧美日韩久久婷婷| 国产精品福利一区二区| 亚洲色成人www永久网站| 亚洲第一视频网| 青青在线视频| 99在线免费观看视频| 一区二区三区在线| 91精品视频国产| 中文字幕在线一区免费| 欧美一级做a爰片免费视频| 亚洲欧美一区二区精品久久久| 黄在线观看免费网站ktv| 国产精品对白一区二区三区| 欧美精品激情| 99riav国产精品视频| 亚洲一二三级电影| 亚洲免费黄色片| 性亚洲最疯狂xxxx高清| 国偷自产视频一区二区久| 无码专区aaaaaa免费视频| 成人免费毛片片v| 国产午夜福利一区二区| 亚洲高清久久网| 蜜桃视频m3u8在线观看| 久久久久免费网| 日日夜夜一区二区| 色婷婷国产精品免| 在线成人免费观看| 伊人手机在线| 成人永久免费| 国产情侣一区| 91成人国产在线观看| 日韩中文字幕视频网| 黄色激情在线视频| 91一区在线观看| 乱子伦一区二区三区| 最新国产精品拍自在线播放| 亚洲毛片在线免费| 日本大片免费看| 91女人视频在线观看| 日韩国产成人在线| 日韩在线精品一区| 91麻豆精品激情在线观看最新 | а√天堂在线官网| 国产精品国产精品国产专区蜜臀ah| 亚洲精品免费观看| 超碰人人人人人人人| 日韩欧美一二三四区| 亚洲少妇视频| 国产精品av免费| 99久久精品免费看国产| 成年人av网站| 欧美成人激情视频免费观看| 欧美1区2区3区4区| 鲁一鲁一鲁一鲁一av| 一区二区三区国产豹纹内裤在线| 香蕉久久国产av一区二区| 国产精品一二三在线| 欧美三区美女| 一级肉体全黄裸片| 精品国产不卡一区二区三区| 欧美momandson| 成年在线观看视频| 久久久777精品电影网影网 | 精品一区二区三区视频| 日本少妇bbwbbw精品| 色偷偷亚洲男人天堂|