精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

微調(diào)已死,強化微調(diào)萬歲

原創(chuàng) 精選
人工智能
與傳統(tǒng)的微調(diào)不同,RFT 側(cè)重于教模型思考和推理問題,正如 OpenAI 的研究主管?Mark Chen?所解釋的那樣:“這不是標準的微調(diào)......它利用強化學習算法,將我們從高級高中水平提升到專家級博士水平。

編輯 | 言征 

出品 | 51CTO技術棧(微信號:blog51cto)

OpenAI第二天的直播,奧特曼沒有出鏡,幾位OpenAI的研究員帶了一場AI模型的定制魔法秀!

“這不是標準的微調(diào)......它利用強化學習算法,將我們從高級高中水平帶到專家級博士水平。”

1.12個樣本,就能讓定制o1超過滿血o1

標準的微調(diào)已經(jīng)過時了,這次 OpenAI 打破了 AI 定制的界限。在其“OpenAI 12 天”直播系列的第二天首次為其 o1 模型提供強化微調(diào) (RFT)。這一新的突破標志著我們所知道的傳統(tǒng)微調(diào)的終結(jié)。使用 RFT,模型不僅可以復制,還可以進行推理。

通過采用強化學習,OpenAI 希望使組織能夠為法律、醫(yī)療保健、金融等領域的復雜任務構(gòu)建專家級 AI。這種新方法使組織能夠使用強化學習來訓練模型,以最少的數(shù)據(jù)(有時只有 12 個示例)處理特定于領域的任務。

通過使用參考答案來評估和優(yōu)化模型輸出,RFT 可以提高專家級任務的推理和準確性。OpenAI 通過微調(diào) o1-mini 模型來演示這項技術,使其能夠比以前的版本更準確地預測遺傳疾病。

2.重新定義模型微調(diào)

與傳統(tǒng)的微調(diào)不同,RFT 側(cè)重于教模型思考和推理問題,正如 OpenAI 的研究主管 Mark Chen 所解釋的那樣:“這不是標準的微調(diào)......它利用強化學習算法,將我們從高級高中水平提升到專家級博士水平。

局限性:該方法并非沒有局限性。OpenAI 工程師 John Allard 解釋說,RFT 在結(jié)果“客觀正確且廣泛同意”的任務中表現(xiàn)出色,但在更難定義共識的主觀領域或創(chuàng)造性應用程序中可能會遇到困難。

然而,與傳統(tǒng)的完全微調(diào)相比,鋼筋微調(diào) (RFT) 通常被認為在計算效率更高。批評者還指出,RFT 的性能在很大程度上取決于任務設計和訓練數(shù)據(jù)的質(zhì)量。

有趣的是,使用 RFT,您只需幾十個示例即可實現(xiàn)顯著的性能改進,因為該模型從反饋中學習,而不需要查看所有可能的場景。

包括伯克利實驗室研究人員在內(nèi)的早期采用者已經(jīng)取得了顯著的成果。例如,微調(diào)的 o1-mini 模型在識別導致罕見疾病的基因突變方面優(yōu)于其基礎版本。

圖片圖片

OpenAI 已向選定的組織開放其 RFT alpha 計劃。參賽團隊將獲得 OpenAI 基礎設施的訪問權(quán)限,以訓練針對其獨特需求優(yōu)化的模型。“開發(fā)人員現(xiàn)在可以利用我們在內(nèi)部使用的相同工具來構(gòu)建特定于領域的專家模型,”Allard 說。

計算生物學家 Justin Reese 強調(diào)了 RFT 在醫(yī)療保健領域的變革潛力,特別是對于影響數(shù)百萬人的罕見疾病——“將領域?qū)I(yè)知識與生物醫(yī)學數(shù)據(jù)的系統(tǒng)推理相結(jié)合的能力正在改變游戲規(guī)則”。

同樣,OpenAI 與湯森路透的合作已經(jīng)證明在微調(diào)法律模型方面取得了成功,為在法律和保險等高風險領域增強 AI 應用鋪平了道路。

3.AI 定制新時代

OpenAI 計劃于 2025 年公開發(fā)布,旨在根據(jù)早期參與者的反饋改進 RFT。除了最初的應用之外,OpenAI 還設想了 RFT 模型推動數(shù)學、研究和基于代理的決策等領域的發(fā)展。“這是關于為人類最復雜的挑戰(zhàn)創(chuàng)建高度專業(yè)化的工具,”Chen 說。

簡而言之,這項技術將 OpenAI 的 o1 系列模型轉(zhuǎn)變?yōu)樘囟I域的專家,使它們能夠以無與倫比的準確性進行推理,并在復雜、高風險的任務中超越其基本版本。

定期微調(diào)通常涉及使用監(jiān)督學習在新數(shù)據(jù)集上訓練預訓練模型,其中模型根據(jù)數(shù)據(jù)集中提供的確切輸出或標簽調(diào)整其參數(shù)。

另一方面,RFT 使用強化學習,模型從對其性能的反饋中學習,而不僅僅是從直接示例中學習。

該模型不是從固定標簽中學習,而是根據(jù)預定義的評分量規(guī)或評分器根據(jù)它在任務中的表現(xiàn)進行評分。這使模型能夠探索不同的解決方案并從結(jié)果中學習,專注于提高推理能力。

4.用戶實測:ChatGPT o1 Pro 感覺就像買了一輛蘭博

在 OpenAI 12 Days 的第一天,該公司發(fā)布了完整版的 o1 和一款售價 200 美元的全新 ChatGPT Pro 機型。ChatGPT Pro 計劃包括 Plus 計劃的所有功能以及對附加 o1 Pro 模式的訪問,據(jù)說該模式使用“更多計算來最好地回答最難的問題”。此外,該計劃將提供對 o1、o1-mini 和 GPT-4o 的無限制訪問以及高級語音模式。

OpenAI 還宣布了該模型的以開發(fā)人員為中心的新功能。其中包括結(jié)構(gòu)化輸出、函數(shù)調(diào)用、開發(fā)人員消息和 API 圖像理解。OpenAI 還表示,他們正在努力為 o1 模型提供 API 支持。

“為了更加明確:O1 在我們的 Plus 級別可用,每月 20 美元。使用新的 Pro Tier(每月 200 美元),它可以更努力地思考最困難的問題。大多數(shù)用戶會對 Plus Tier 中的 O1 感到非常滿意!“OpenAI 首席執(zhí)行官 Sam Altman 在 X 上發(fā)帖。

社區(qū)中的許多人認為 200 美元對于 ChatGPT Pro 訂閱來說太貴了。“不要以為我需要每月 200 美元的 o1 Pro。o1 對我來說就足夠了。哎呀,對我來說就足夠了,“X 上的一位用戶發(fā)帖說。

“ChatGPT o1 Pro 感覺就像買了一輛蘭博基尼。”

沃頓商學院的副教授 Ethan Mollick 可以提前接觸 o1,他分享了他的經(jīng)驗,并將其與 Claude Sonnet 3.5 和 Gemini 進行了比較。“它可以解決一些博士級別的問題,在科學、金融等高價值領域有明顯的應用。發(fā)現(xiàn)用途需要真正的研發(fā)努力“。

他解釋說,雖然 o1 在解決 Sonnet 難以解決的特定難題方面優(yōu)于 Sonnet,但它并沒有在每個領域都超過 Sonnet。Sonnet 在其他領域仍然更強大。“作為作家而言,o1 表現(xiàn)得并沒有想象中地更好,不過它通常能夠比 Sonnet 更好地發(fā)展復雜的情節(jié),因為它可以更好地提前計劃。”

一位 Reddit 用戶在花了 8 小時在實際應用程序中測試 OpenAI 的 o1 Pro(200 美元)與 Claude Sonnet 3.5(20 美元)后分享了他們的經(jīng)驗。

對于復雜的推理,o1 Pro 是贏家,它提供的結(jié)果略好,但每個響應的時間多了 20-30 秒。Claude Sonnet 3.5 雖然更快,但在這些任務上達到了 90% 的準確率。在代碼生成方面,Claude Sonnet 3.5 的性能優(yōu)于 o1 Pro,它生成的代碼更簡潔、更易于維護,文檔更好,而 o1 Pro 傾向于過度設計解決方案。

同樣,Abacus AI 首席執(zhí)行官 Bindu Reddy 表示,Sonnet 3.5 在編碼方面仍然優(yōu)于 o1,這是根據(jù)她進行的手動測試,因為 OpenAI 尚未發(fā)布 API。

“早期跡象表明,Sonnet 3.5 在編碼方面仍然占據(jù)主導地位。每當 OpenAI 選擇提供 API 時,我們都將能夠確認這一結(jié)果,“她說。

參考鏈接:https://analyticsindiamag.com/ai-origins-evolution/fine-tuning-is-dead-long-live-reinforcement-fine-tuning/

想了解更多AIGC的內(nèi)容,請訪問:

51CTO AI.x社區(qū)

http://m.jxzklqfsx.com/aigc/

責任編輯:武曉燕 來源: 51CTO技術棧
相關推薦

2013-02-26 11:01:42

CIO信息化大數(shù)據(jù)云計算

2010-04-06 09:02:59

Solaris甲骨文Sun

2019-10-11 08:58:21

Hadoop開源

2015-04-23 09:34:18

CoffeeScripJavaScript開

2013-03-29 10:13:22

lisp編譯器

2024-10-15 11:16:18

2015-11-05 10:17:42

網(wǎng)絡工程師IT人員

2025-10-11 18:05:23

AI智能體模型

2018-01-08 07:58:51

深度學習編程人工智能

2025-01-13 08:20:00

AI模型訓練

2025-10-29 08:40:00

2025-10-11 08:52:06

2025-06-26 09:06:59

2015-05-20 09:05:40

2025-11-07 08:51:41

2023-10-07 10:41:54

語言模型微調(diào)BitFit

2024-07-22 08:17:00

模型性能

2013-11-21 11:03:29

Nginx性能優(yōu)化

2025-06-23 09:09:00

2024-12-09 09:50:00

數(shù)據(jù)模型
點贊
收藏

51CTO技術棧公眾號

一级黄色大片免费观看| 国产精久久一区二区三区| 在线中文字幕-区二区三区四区| 精品中文字幕一区二区小辣椒| 欧美乱大交xxxxx另类电影| 亚洲国产日韩在线一区| 麻豆成全视频免费观看在线看| 91论坛在线播放| 国产在线播放91| 国产精品7777777| 日韩精品影视| 欧美一区二区三区四区五区| 国产中文字幕二区| 欧美成人xxx| 成人99免费视频| 国产精品美女久久久久av超清| 久久久久噜噜噜亚洲熟女综合| 九九热爱视频精品视频| 欧美刺激午夜性久久久久久久| 成人观看免费完整观看| 爆操欧美美女| 国产欧美日韩视频在线观看| 国产精品一区二区三区精品| 超碰在线免费97| 日韩一级免费| 久久夜色精品国产欧美乱| 国产精品一色哟哟哟| 91禁外国网站| 欧美三级小视频| 久久成人综合| 亚洲精选在线观看| 1314成人网| a成人v在线| 色偷偷88欧美精品久久久| 蜜桃网站在线观看| 在线观看免费高清完整| 久久精品一二三| 激情小说综合区| www.蜜臀av.com| 毛片av一区二区| 国产精品爱啪在线线免费观看| 日韩精品成人一区| 欧美日本不卡| 久久亚洲精品毛片| 成人性视频免费看| 成人精品视频| 国产一区二区黑人欧美xxxx| 深爱五月激情网| 欧美调教网站| 亚洲精品不卡在线| 色哟哟视频在线| 在线日韩成人| 日韩欧美第一区| 91看片破解版| 国产专区精品| 欧美一区二区三区日韩视频| а 天堂 在线| 超碰国产精品一区二页| 欧美精品第1页| 欧美性受xxxxxx黑人xyx性爽| 岛国一区二区| 欧美日韩综合在线| xxx国产在线观看| 电影91久久久| 欧美大肚乱孕交hd孕妇| 荫蒂被男人添免费视频| 国产精品高潮呻吟久久久久 | 天天干天天色综合| 久久精品综合| 国产精品网址在线| 中文字幕一区2区3区| 老汉av免费一区二区三区| 成人乱人伦精品视频在线观看| 888奇米影视| 国产精品影视天天线| 国产精品久久久对白| 五月激情丁香婷婷| 国产校园另类小说区| 亚洲欧美久久234| 国产1区在线| 亚洲一二三区在线观看| 国产成人精品视频免费看| 亚洲四虎影院| 日韩一区二区三区视频| 好男人香蕉影院| 久久99青青| 日韩有码片在线观看| 青青草偷拍视频| 国产日韩欧美一区在线 | 国产亚洲精品一区二555| 亚洲色图日韩精品| 欧美午夜久久| 日韩av电影中文字幕| 中文字幕一区二区人妻| 成人做爰69片免费看网站| 久久精品国产精品青草色艺| av在线播放免费| 亚洲一区二区三区四区的| 日本在线观看a| 国产一区2区在线观看| 亚洲黄色有码视频| 日日操免费视频| 亚洲毛片一区| 成人自拍性视频| 神马久久高清| 国产精品入口麻豆九色| 国产精品69久久久| 主播大秀视频在线观看一区二区| 日韩欧美你懂的| 国产熟女一区二区| 在线免费观看欧美| 成人天堂噜噜噜| 黄色片免费在线| 洋洋成人永久网站入口| 午夜在线观看av| 久久影视三级福利片| 久久亚洲私人国产精品va| 好看的av在线| 国产不卡免费视频| 亚洲午夜精品国产| 成人免费看黄| 亚洲福利小视频| 亚洲不卡在线播放| 日韩高清一级片| 精品无人乱码一区二区三区的优势| 视频免费一区| 福利视频一区二区| 黄色三级视频在线播放| 欧美日韩国产高清电影| 久久久亚洲成人| 亚洲熟女乱色一区二区三区久久久| 91麻豆免费观看| 成人免费网站入口| 精品国产乱码久久久久久樱花| 中文字幕无线精品亚洲乱码一区 | 欧美日韩视频在线播放| 在线免费观看成人短视频| 在线观看av中文字幕| 欧美激情偷拍| 亚洲最大成人在线| 免费在线观看av片| 欧美日韩综合色| 色婷婷国产精品免| 免费观看一级特黄欧美大片| 欧美一区二区三区四区夜夜大片| 黄视频网站在线观看| 精品久久久久久久久久久久久久久 | www.色国产| 久久这里只有精品首页| 国产最新免费视频| 国产91一区| 日韩免费在线免费观看| 免费人成在线观看网站| 一本一本大道香蕉久在线精品| 精品黑人一区二区三区观看时间| 亚洲国产黄色| 久久精品日产第一区二区三区乱码| av在线加勒比| 日韩高清免费观看| 男人天堂2024| 国产欧美视频一区二区| 蜜臀av免费观看| 久久久久久久久99精品大| 91日本视频在线| 丝袜中文在线| 亚洲国产91色在线| 国产精品男女视频| 久久久久久综合| 少妇一级淫免费播放| 国产精品毛片一区二区在线看| 91精品综合久久久久久五月天| av免费看在线| 亚洲高清在线观看| 欧美性猛交xxxx乱大交hd | 欧美第一区第二区| 欧美成人一二三区| 99国产欧美另类久久久精品| 久久久久久久激情| 奇米影视亚洲| 91欧美视频网站| 女厕盗摄一区二区三区| 亚洲性无码av在线| 国产免费黄色片| 亚洲成a人v欧美综合天堂| 91精品人妻一区二区三区| 另类的小说在线视频另类成人小视频在线| 亚洲资源视频| a级日韩大片| 国产成人亚洲综合91精品| 黄色小网站在线观看| 欧美精品一区二区三区蜜臀| www.com亚洲| 亚洲精品中文字幕乱码三区| 国产精品无码在线| 秋霞电影网一区二区| 久久www视频| 国产精品三级| 亚洲综合成人婷婷小说| 一区一区三区| 不卡av电影在线观看| 四虎影视在线播放| 欧美日本一区二区在线观看| 国产一级特黄a高潮片| 国产三级精品视频| 欧美图片自拍偷拍| 日本aⅴ亚洲精品中文乱码| bt天堂新版中文在线地址| 国产一区二区三区四区| 国产精品福利视频| 久草综合在线| 啪一啪鲁一鲁2019在线视频| av在线免费观看网址| 亚洲系列中文字幕| 韩国av电影在线观看| 欧美日韩国产三级| 久久久久99精品成人片我成大片| 一区二区三区欧美久久| 长河落日免费高清观看| 91老司机福利 在线| 能看毛片的网站| 久久国产人妖系列| 午夜dv内射一区二区| 亚洲主播在线| 青草视频在线观看视频| 在线成人直播| 亚洲欧洲日韩综合二区| 国产成人精品三级高清久久91| 国产精品久久久久免费| 国内精品视频| 成人黄色av播放免费| 婷婷综合六月| 欧洲午夜精品久久久| 日本免费一区二区六区| 韩剧1988免费观看全集| caoporm免费视频在线| 日日噜噜噜夜夜爽亚洲精品| 国产在线一在线二| 亚洲男人7777| 婷婷色在线观看| 精品国产乱码久久久久久牛牛 | 亚洲福利视频网| 亚洲精品国产精品国| 91精品国产91久久综合桃花| 一本色道久久综合精品婷婷| 欧美日韩一区二区三区高清| 免费看av在线| 在线观看成人小视频| 黄色污污网站在线观看| 一本久久a久久免费精品不卡| 国内免费精品视频| 精品国产福利视频| 日韩av女优在线观看| 性做久久久久久免费观看| 精品一级少妇久久久久久久| 亚洲综合成人网| 国产一级一级片| 婷婷久久综合九色综合绿巨人| 天海翼一区二区| 精品美女永久免费视频| 久久精品视频1| 色网综合在线观看| 中文字幕二区三区| 在线播放91灌醉迷j高跟美女 | 桃色一区二区| 国产精品视频1区| 在线日韩三级| 成人xxxxx色| 人人网欧美视频| 午夜精品美女久久久久av福利| 久久精品国产www456c0m| 欧美三级午夜理伦三级老人| 国产字幕视频一区二区| 久久久久久久久久网| 久久国产日本精品| 制服丝袜综合网| 国产激情精品久久久第一区二区 | 国产二区视频在线播放| 日韩国产精品久久| 嫩草视频免费在线观看| 国产91精品免费| 自拍偷拍亚洲天堂| 国产精品国产三级国产普通话蜜臀| 欧美日韩黄色网| 精品久久久中文| 伊人亚洲综合网| 精品国产髙清在线看国产毛片 | 99这里只有精品视频| 欧美 日韩 国产在线| 色偷偷综合网| 一二三四视频社区在线| 免费人成在线不卡| 深夜视频在线观看| 国产欧美一区二区精品性色超碰 | 国产中文字幕日韩| 国产毛片久久久| 午夜一区二区三区| 亚洲成人资源| 中文字幕在线观看日| 99视频精品全部免费在线| 青青青手机在线视频| 亚洲图片欧美综合| 在线观看中文字幕av| 亚洲高清不卡av| 国产黄a三级三级三级av在线看 | 99国产精品久久| 一区二区三区四区五区| 色综合天天综合在线视频| 999久久久久| 国产一区二区三区在线观看网站| 日韩激情av| 国产中文字幕亚洲| 国产91精品对白在线播放| 国产成人在线小视频| 久久精品999| 91精品人妻一区二区三区| 亚洲国产一区二区在线播放| 国产一区二区三区中文字幕| 亚洲欧美国产va在线影院| 免费毛片在线看片免费丝瓜视频 | a在线观看免费视频| 99久久久精品| 欧美成人免费看| 欧美猛男gaygay网站| 国产露出视频在线观看| 6080yy精品一区二区三区| 99这里只有精品视频| 国产经典久久久| 国产综合久久久久影院| 欧美黄色高清视频| 色就色 综合激情| 午夜在线视频观看| 欧美激情在线一区| 日韩成人久久| 99热这里只有精品7| 久久精品国产99国产精品| 亚洲精品成人av久久| 色婷婷久久一区二区三区麻豆| 神宫寺奈绪一区二区三区| 久久久久久中文字幕| 国产精品传媒| 国产96在线 | 亚洲| 成人av网站在线观看| 国产性猛交普通话对白| 欧美成人乱码一区二区三区| 在线网址91| 国产v亚洲v天堂无码| 狠狠噜噜久久| 国产一线在线观看| 午夜不卡在线视频| 天堂av中文在线资源库| 欧美在线视频一二三| 亚洲最大在线| 欧美综合在线观看视频| 久久综合一区二区| 久久精品久久久久久久| 亚洲最新av网址| 欧美综合影院| 97超碰免费观看| 丰满白嫩尤物一区二区| 国产午夜免费视频| 亚洲精品久久久久中文字幕二区 | 国产在线观看91精品一区| 久久综合88| 自拍一级黄色片| 亚洲高清视频在线| 日韩精品系列| 国产精品久久久久久久美男| 91精品综合久久久久久久久久久| 在线观看视频在线观看| 亚洲成人免费视| 日本a一级在线免费播放| 国产精品久久久久久久久久久新郎 | 精品网站999www| 777午夜精品电影免费看| 亚洲图片都市激情| 国产精品996| 日韩人妻无码一区二区三区99 | 日本黄色特级片| 欧美日韩一级二级| 日本在线视频网址| 欧美日韩精品免费观看| 久久综合综合久久综合| 毛片a片免费观看| 亚洲九九九在线观看| 大胆国模一区二区三区| 久久精品国产sm调教网站演员| 久久精品视频一区二区| 国产男女无套免费网站| 7777免费精品视频| 日韩在线观看一区| 五月天丁香社区| 欧美三级三级三级| 黑人极品ⅴideos精品欧美棵| 蜜桃网站成人| 国产精选一区二区三区| 日本a级c片免费看三区| 另类图片亚洲另类| 国内精品伊人久久久| 又大又长粗又爽又黄少妇视频| 色综合久久九月婷婷色综合|