精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

微調(diào)已死,強(qiáng)化微調(diào)萬(wàn)歲 原創(chuàng)

發(fā)布于 2024-12-10 09:06
瀏覽
0收藏

編輯 | 言征 

出品 | 51CTO技術(shù)棧(微信號(hào):blog51cto)

OpenAI第二天的直播,奧特曼沒(méi)有出鏡,幾位OpenAI的研究員帶了一場(chǎng)AI模型的定制魔法秀!

“這不是標(biāo)準(zhǔn)的微調(diào)......它利用強(qiáng)化學(xué)習(xí)算法,將我們從高級(jí)高中水平帶到專家級(jí)博士水平。”

1.12個(gè)樣本,就能讓定制o1超過(guò)滿血o1

標(biāo)準(zhǔn)的微調(diào)已經(jīng)過(guò)時(shí)了,這次 OpenAI 打破了 AI 定制的界限。在其“OpenAI 12 天”直播系列的第二天首次為其 o1 模型提供強(qiáng)化微調(diào) (RFT)。這一新的突破標(biāo)志著我們所知道的傳統(tǒng)微調(diào)的終結(jié)。使用 RFT,模型不僅可以復(fù)制,還可以進(jìn)行推理。

通過(guò)采用強(qiáng)化學(xué)習(xí),OpenAI 希望使組織能夠?yàn)榉伞⑨t(yī)療保健、金融等領(lǐng)域的復(fù)雜任務(wù)構(gòu)建專家級(jí) AI。這種新方法使組織能夠使用強(qiáng)化學(xué)習(xí)來(lái)訓(xùn)練模型,以最少的數(shù)據(jù)(有時(shí)只有 12 個(gè)示例)處理特定于領(lǐng)域的任務(wù)。

通過(guò)使用參考答案來(lái)評(píng)估和優(yōu)化模型輸出,RFT 可以提高專家級(jí)任務(wù)的推理和準(zhǔn)確性。OpenAI 通過(guò)微調(diào) o1-mini 模型來(lái)演示這項(xiàng)技術(shù),使其能夠比以前的版本更準(zhǔn)確地預(yù)測(cè)遺傳疾病。

2.重新定義模型微調(diào)

與傳統(tǒng)的微調(diào)不同,RFT 側(cè)重于教模型思考和推理問(wèn)題,正如 OpenAI 的研究主管 Mark Chen 所解釋的那樣:“這不是標(biāo)準(zhǔn)的微調(diào)......它利用強(qiáng)化學(xué)習(xí)算法,將我們從高級(jí)高中水平提升到專家級(jí)博士水平。

局限性:該方法并非沒(méi)有局限性。OpenAI 工程師 John Allard 解釋說(shuō),RFT 在結(jié)果“客觀正確且廣泛同意”的任務(wù)中表現(xiàn)出色,但在更難定義共識(shí)的主觀領(lǐng)域或創(chuàng)造性應(yīng)用程序中可能會(huì)遇到困難。

然而,與傳統(tǒng)的完全微調(diào)相比,鋼筋微調(diào) (RFT) 通常被認(rèn)為在計(jì)算效率更高。批評(píng)者還指出,RFT 的性能在很大程度上取決于任務(wù)設(shè)計(jì)和訓(xùn)練數(shù)據(jù)的質(zhì)量。

有趣的是,使用 RFT,您只需幾十個(gè)示例即可實(shí)現(xiàn)顯著的性能改進(jìn),因?yàn)樵撃P蛷姆答佒袑W(xué)習(xí),而不需要查看所有可能的場(chǎng)景。

包括伯克利實(shí)驗(yàn)室研究人員在內(nèi)的早期采用者已經(jīng)取得了顯著的成果。例如,微調(diào)的 o1-mini 模型在識(shí)別導(dǎo)致罕見(jiàn)疾病的基因突變方面優(yōu)于其基礎(chǔ)版本。

微調(diào)已死,強(qiáng)化微調(diào)萬(wàn)歲-AI.x社區(qū)圖片

OpenAI 已向選定的組織開(kāi)放其 RFT alpha 計(jì)劃。參賽團(tuán)隊(duì)將獲得 OpenAI 基礎(chǔ)設(shè)施的訪問(wèn)權(quán)限,以訓(xùn)練針對(duì)其獨(dú)特需求優(yōu)化的模型。“開(kāi)發(fā)人員現(xiàn)在可以利用我們?cè)趦?nèi)部使用的相同工具來(lái)構(gòu)建特定于領(lǐng)域的專家模型,”Allard 說(shuō)。

計(jì)算生物學(xué)家 Justin Reese 強(qiáng)調(diào)了 RFT 在醫(yī)療保健領(lǐng)域的變革潛力,特別是對(duì)于影響數(shù)百萬(wàn)人的罕見(jiàn)疾病——“將領(lǐng)域?qū)I(yè)知識(shí)與生物醫(yī)學(xué)數(shù)據(jù)的系統(tǒng)推理相結(jié)合的能力正在改變游戲規(guī)則”。

同樣,OpenAI 與湯森路透的合作已經(jīng)證明在微調(diào)法律模型方面取得了成功,為在法律和保險(xiǎn)等高風(fēng)險(xiǎn)領(lǐng)域增強(qiáng) AI 應(yīng)用鋪平了道路。

3.AI 定制新時(shí)代

OpenAI 計(jì)劃于 2025 年公開(kāi)發(fā)布,旨在根據(jù)早期參與者的反饋改進(jìn) RFT。除了最初的應(yīng)用之外,OpenAI 還設(shè)想了 RFT 模型推動(dòng)數(shù)學(xué)、研究和基于代理的決策等領(lǐng)域的發(fā)展。“這是關(guān)于為人類最復(fù)雜的挑戰(zhàn)創(chuàng)建高度專業(yè)化的工具,”Chen 說(shuō)。

簡(jiǎn)而言之,這項(xiàng)技術(shù)將 OpenAI 的 o1 系列模型轉(zhuǎn)變?yōu)樘囟I(lǐng)域的專家,使它們能夠以無(wú)與倫比的準(zhǔn)確性進(jìn)行推理,并在復(fù)雜、高風(fēng)險(xiǎn)的任務(wù)中超越其基本版本。

定期微調(diào)通常涉及使用監(jiān)督學(xué)習(xí)在新數(shù)據(jù)集上訓(xùn)練預(yù)訓(xùn)練模型,其中模型根據(jù)數(shù)據(jù)集中提供的確切輸出或標(biāo)簽調(diào)整其參數(shù)。

另一方面,RFT 使用強(qiáng)化學(xué)習(xí),模型從對(duì)其性能的反饋中學(xué)習(xí),而不僅僅是從直接示例中學(xué)習(xí)。

該模型不是從固定標(biāo)簽中學(xué)習(xí),而是根據(jù)預(yù)定義的評(píng)分量規(guī)或評(píng)分器根據(jù)它在任務(wù)中的表現(xiàn)進(jìn)行評(píng)分。這使模型能夠探索不同的解決方案并從結(jié)果中學(xué)習(xí),專注于提高推理能力。

4.用戶實(shí)測(cè):ChatGPT o1 Pro 感覺(jué)就像買了一輛蘭博

在 OpenAI 12 Days 的第一天,該公司發(fā)布了完整版的 o1 和一款售價(jià) 200 美元的全新 ChatGPT Pro 機(jī)型。ChatGPT Pro 計(jì)劃包括 Plus 計(jì)劃的所有功能以及對(duì)附加 o1 Pro 模式的訪問(wèn),據(jù)說(shuō)該模式使用“更多計(jì)算來(lái)最好地回答最難的問(wèn)題”。此外,該計(jì)劃將提供對(duì) o1、o1-mini 和 GPT-4o 的無(wú)限制訪問(wèn)以及高級(jí)語(yǔ)音模式。

OpenAI 還宣布了該模型的以開(kāi)發(fā)人員為中心的新功能。其中包括結(jié)構(gòu)化輸出、函數(shù)調(diào)用、開(kāi)發(fā)人員消息和 API 圖像理解。OpenAI 還表示,他們正在努力為 o1 模型提供 API 支持。

“為了更加明確:O1 在我們的 Plus 級(jí)別可用,每月 20 美元。使用新的 Pro Tier(每月 200 美元),它可以更努力地思考最困難的問(wèn)題。大多數(shù)用戶會(huì)對(duì) Plus Tier 中的 O1 感到非常滿意!“OpenAI 首席執(zhí)行官 Sam Altman 在 X 上發(fā)帖。

社區(qū)中的許多人認(rèn)為 200 美元對(duì)于 ChatGPT Pro 訂閱來(lái)說(shuō)太貴了。“不要以為我需要每月 200 美元的 o1 Pro。o1 對(duì)我來(lái)說(shuō)就足夠了。哎呀,對(duì)我來(lái)說(shuō)就足夠了,“X 上的一位用戶發(fā)帖說(shuō)。

“ChatGPT o1 Pro 感覺(jué)就像買了一輛蘭博基尼。”

沃頓商學(xué)院的副教授 Ethan Mollick 可以提前接觸 o1,他分享了他的經(jīng)驗(yàn),并將其與 Claude Sonnet 3.5 和 Gemini 進(jìn)行了比較。“它可以解決一些博士級(jí)別的問(wèn)題,在科學(xué)、金融等高價(jià)值領(lǐng)域有明顯的應(yīng)用。發(fā)現(xiàn)用途需要真正的研發(fā)努力“。

他解釋說(shuō),雖然 o1 在解決 Sonnet 難以解決的特定難題方面優(yōu)于 Sonnet,但它并沒(méi)有在每個(gè)領(lǐng)域都超過(guò) Sonnet。Sonnet 在其他領(lǐng)域仍然更強(qiáng)大。“作為作家而言,o1 表現(xiàn)得并沒(méi)有想象中地更好,不過(guò)它通常能夠比 Sonnet 更好地發(fā)展復(fù)雜的情節(jié),因?yàn)樗梢愿玫靥崆坝?jì)劃。”

一位 Reddit 用戶在花了 8 小時(shí)在實(shí)際應(yīng)用程序中測(cè)試 OpenAI 的 o1 Pro(200 美元)與 Claude Sonnet 3.5(20 美元)后分享了他們的經(jīng)驗(yàn)。

對(duì)于復(fù)雜的推理,o1 Pro 是贏家,它提供的結(jié)果略好,但每個(gè)響應(yīng)的時(shí)間多了 20-30 秒。Claude Sonnet 3.5 雖然更快,但在這些任務(wù)上達(dá)到了 90% 的準(zhǔn)確率。在代碼生成方面,Claude Sonnet 3.5 的性能優(yōu)于 o1 Pro,它生成的代碼更簡(jiǎn)潔、更易于維護(hù),文檔更好,而 o1 Pro 傾向于過(guò)度設(shè)計(jì)解決方案。

同樣,Abacus AI 首席執(zhí)行官 Bindu Reddy 表示,Sonnet 3.5 在編碼方面仍然優(yōu)于 o1,這是根據(jù)她進(jìn)行的手動(dòng)測(cè)試,因?yàn)?OpenAI 尚未發(fā)布 API。

“早期跡象表明,Sonnet 3.5 在編碼方面仍然占據(jù)主導(dǎo)地位。每當(dāng) OpenAI 選擇提供 API 時(shí),我們都將能夠確認(rèn)這一結(jié)果,“她說(shuō)。

參考鏈接:https://analyticsindiamag.com/ai-origins-evolution/fine-tuning-is-dead-long-live-reinforcement-fine-tuning/

本文轉(zhuǎn)載自??51CTO技術(shù)棧??,作者:言征

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請(qǐng)注明出處,否則將追究法律責(zé)任
標(biāo)簽
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
社區(qū)精華內(nèi)容

目錄

    亚洲午夜视频在线观看| 国产 高清 精品 在线 a| 欧美交换配乱吟粗大25p| 亚洲欧美国产高清va在线播放| 在线观看一区| 中文欧美日本在线资源| 在线成人精品视频| 成人影院网站| 一区二区三区免费网站| 欧美日韩国产三区| 精品国产999久久久免费| 裸体素人女欧美日韩| 久久综合电影一区| 亚欧洲乱码视频| 亚洲码欧美码一区二区三区| 色婷婷精品大视频在线蜜桃视频| 7777在线视频| 二区在线视频| yourporn久久国产精品| 91免费高清视频| 国产免费www| 亚洲国产精品一区制服丝袜| 色多多国产成人永久免费网站| 影音先锋资源av| 亚洲免费看片| 欧美午夜精品久久久久久超碰| 夜夜添无码一区二区三区| 日韩免费网站| 国产亚洲va综合人人澡精品| 国产在线视频欧美一区二区三区| 99国产精品一区二区三区| 日韩国产高清影视| 欧美一级成年大片在线观看 | 久久久久97| 7777精品伊人久久久大香线蕉经典版下载 | 国产精品r级在线| 日韩av女优在线观看| 欧美 日韩 国产 一区| 中文字幕亚洲精品| 日本少妇xxxxx| 亚洲国产最新| 亚洲精品久久7777777| 精品人妻一区二区免费| silk一区二区三区精品视频| 91精品国产91久久久久久一区二区 | 美女搞黄视频在线观看| 亚洲国产一区二区视频| 日韩精品一区二区免费| 蜜桃传媒在线观看免费进入| 亚洲精品ww久久久久久p站| 三年中文高清在线观看第6集| 午夜毛片在线| 亚洲色图清纯唯美| 色乱码一区二区三区熟女 | 国产精品少妇自拍| 午夜精品一区二区在线观看的| 欧美色视频免费| 久久久精品黄色| 日韩欧美三级电影| avav免费在线观看| 国产精品高潮呻吟久久| 在线观看福利一区| av免费在线观看网址| 亚洲九九爱视频| 国产经典久久久| 久久五月精品中文字幕| 亚洲成在人线免费| 欧美性久久久久| 99久久久国产精品免费调教网站| 欧美日韩成人综合| 亚洲av毛片在线观看| 天堂精品久久久久| 精品亚洲一区二区| 纪美影视在线观看电视版使用方法| 大片网站久久| 蜜臀久久99精品久久久久久宅男| 九九九免费视频| 一区二区三区四区五区精品视频 | 国模精品视频一区二区| 成人午夜视频在线播放| 日本中文字幕不卡| 91丨九色丨国产在线| 国产小视频一区| 国产午夜精品久久久久久久| 欧美日韩亚洲国产成人| 搞黄网站在线看| 色老综合老女人久久久| 青青草原国产在线视频| japanese色系久久精品| 亚洲一级免费视频| 激情五月婷婷小说| 视频一区国产视频| 亚洲一区中文字幕在线观看| 亚州av在线播放| 亚洲人一二三区| 国产91在线视频观看| 亚洲一区二区小说| 亚洲男人7777| 久久免费精彩视频| 日本欧美大码aⅴ在线播放| 999国产在线| 国产色在线 com| 亚洲福利一区二区| 色婷婷.com| 尤物tv在线精品| 欧美乱妇高清无乱码| 波多野结衣激情视频| 国产不卡视频一区二区三区| 先锋在线资源一区二区三区| 啦啦啦中文在线观看日本| 欧美性受xxxx黑人xyx性爽| 四虎成人免费视频| 国产精品成人a在线观看| 26uuu久久噜噜噜噜| 精品久久在线观看| 国产精品亲子伦对白| 国产亚洲欧美在线视频| 日韩高清在线观看一区二区| 在线电影欧美日韩一区二区私密| 久久成人国产精品入口| 国产一区三区三区| 天天综合色天天综合色hd| 极品视频在线| 亚洲а∨天堂久久精品9966 | 成人免费在线电影| 五月天中文字幕一区二区| 伊人五月天婷婷| 久久精品国产99久久| 国产精品mp4| 三级在线视频| 欧美午夜精品伦理| 亚洲色偷偷色噜噜狠狠99网| 亚洲综合小说| 亚洲伊人久久综合| 顶级网黄在线播放| 在线不卡a资源高清| youjizz亚洲女人| 奇米四色…亚洲| 日日骚一区二区网站| 韩日精品一区二区| 亚洲美女中文字幕| 91美女免费看| 久久嫩草精品久久久久| 91视频最新入口| 先锋影音国产精品| 日韩免费观看网站| 国产一二三区在线视频| 一本久道久久综合中文字幕 | 五月激情婷婷网| 欧美日韩精品二区| 国产制服丝袜在线| 香蕉久久久久久久av网站| 欧美连裤袜在线视频| 东京一区二区| 曰本色欧美视频在线| 亚洲av综合一区| 亚洲天堂福利av| 中文字幕乱码在线人视频| 欧美日韩在线大尺度| 国内一区在线| 欧美日韩成人影院| 最新日韩中文字幕| 99国产精品久久久久久久成人| 一级中文字幕一区二区| 日本一级片在线播放| 久久婷婷亚洲| 中文精品一区二区三区| 欧洲精品99毛片免费高清观看| 久久免费视频网站| 欧美日韩国产综合视频| 欧美日韩一区二区在线视频| 97成人资源站| 成年人国产精品| 成人免费毛片播放| 久久久久久免费视频| 国产一区二区无遮挡| 欧美7777| 九九精品在线视频| 你懂的视频在线免费| 777a∨成人精品桃花网| 国产午夜久久久| 国产欧美一区二区在线观看| 亚洲制服在线观看| 国产精品亚洲产品| 超碰97免费观看| 久久99影视| 亚洲www在线观看| 成人免费看黄| 欧美另类xxx| 黄色小视频在线观看| 日韩精品最新网址| 波多野结衣午夜| 亚洲一线二线三线视频| 日本黄色小视频在线观看| 成人网在线免费视频| 国内自拍视频一区| 亚洲国产一区二区三区a毛片| 日韩理论片在线观看| 婷婷视频一区二区三区| 国产精品爽黄69| 欧美aa在线观看| 久久夜色精品国产亚洲aⅴ| 日本1级在线| 欧美大片日本大片免费观看| 成人黄色三级视频| 亚洲3atv精品一区二区三区| 熟女少妇a性色生活片毛片| 91偷拍与自偷拍精品| 又黄又爽又色的视频| 麻豆国产一区二区| 国产黄色特级片| 国产日韩一区二区三区在线播放| 精品国产一区二区三区在线| 日韩免费视频| 欧美综合77777色婷婷| 荡女精品导航| 91成人伦理在线电影| jizz久久久久久| 国产不卡av在线免费观看| 99久久精品免费看国产小宝寻花| 北条麻妃在线一区二区| 大胆av不用播放器在线播放| 国产丝袜一区二区| 色噜噜在线播放| 精品久久一区二区| 国产xxxx在线观看| 欧美精品tushy高清| 中文字幕+乱码+中文乱码www| 岛国视频午夜一区免费在线观看| 久久久久久久国产视频| 一区二区三区毛片| 国产精品视频一区二区三| 国产精品国产a级| 精品人体无码一区二区三区| 亚洲国产激情av| 变态另类ts人妖一区二区| 久久久精品国产免大香伊| 亚洲天堂网一区二区| 26uuu国产在线精品一区二区| 久久福利小视频| 99国产精品久久| 中文字幕狠狠干| 久久免费精品国产久精品久久久久 | 日本国产中文字幕| 狠狠久久婷婷| xxxx18hd亚洲hd捆绑| 在线综合亚洲| 女人扒开屁股爽桶30分钟| 麻豆91精品| 三级在线免费看| 极品少妇一区二区| 三级av免费看| 成人午夜视频在线| 亚洲中文字幕一区| 久久久蜜桃精品| 亚洲色图日韩精品| 综合激情成人伊人| 久久精品波多野结衣| 香蕉加勒比综合久久| 国产精品久久久免费视频| 色偷偷成人一区二区三区91| 成人黄色片在线观看 | 亚洲国产精品欧美久久| 精品国产一二三| 色播色播色播色播色播在线| 国产一区二区动漫| 最新电影电视剧在线观看免费观看| 日韩亚洲综合在线| 狂野欧美性猛交xxxxx视频| 欧洲亚洲妇女av| 国产精品诱惑| 成人三级视频在线观看一区二区| 精品国产午夜肉伦伦影院| 欧洲久久久久久| 亚洲精品网址| 国产二级片在线观看| 美女一区二区三区| 在线观看欧美一区二区| 91在线视频网址| 网站永久看片免费| 亚瑟在线精品视频| а中文在线天堂| 亚洲精品一区二区三区影院| 欧美女同网站| 欧美成人性色生活仑片| 伊人久久综合一区二区| 91精品美女在线| 欧美高清视频看片在线观看| 一区二区视频在线播放| av成人天堂| 国产毛片久久久久久| 91色综合久久久久婷婷| 国产色无码精品视频国产| 无码av免费一区二区三区试看| 亚洲国产无线乱码在线观看| 欧美成人三级电影在线| av在线播放网站| 97视频色精品| 欧美h版在线观看| 欧洲一区二区日韩在线视频观看免费| 午夜精品999| 91福利国产成人精品播放| 波波电影院一区二区三区| 久久久久久久麻豆| 色哟哟日韩精品| 搡老岳熟女国产熟妇| 麻豆国产精品va在线观看不卡| 欧洲亚洲两性| 精品一区二区三区自拍图片区| 中文不卡在线| 国产精品久久久毛片| 93久久精品日日躁夜夜躁欧美| 欧美日韩免费做爰视频| 欧美日韩午夜在线视频| 欧美日韩国产综合视频 | 丝袜美腿一区| 国产在线精品一区二区中文| 综合视频在线| 99热一区二区| 国产精品美日韩| www.com亚洲| 亚洲精品一区二区三区不| 国内高清免费在线视频| 亚洲自拍偷拍区| 希岛爱理一区二区三区| 国产精品久久a| 国产喂奶挤奶一区二区三区 | 制服丝袜中文字幕一区| 91社区在线高清| 国产精品扒开腿做爽爽爽视频| 天堂一区二区三区四区| 五月丁香综合缴情六月小说| 成人深夜在线观看| 国产亚洲第一页| 亚洲第一中文字幕| av中文字幕电影在线看| 国产精品对白刺激久久久| 综合国产精品| 国产吃瓜黑料一区二区| 一区二区三区四区在线播放 | 超碰中文字幕在线| 日韩成人中文字幕在线观看| 国产激情视频在线看| 国产一区二区精品在线| 99精品视频免费观看视频| 黄色录像a级片| 五月天激情小说综合| 神马精品久久| 日本久久精品视频| 国产精品自拍区| 在线看的黄色网址| 国产精品不卡一区二区三区| 国产丝袜在线视频| 色综合久久88| 欧美亚视频在线中文字幕免费| 97国产精东麻豆人妻电影| 91免费视频大全| 糖心vlog精品一区二区| 日韩一区二区三区在线播放| av在线成人| 成人午夜精品久久久久久久蜜臀| 91麻豆国产精品久久| 超碰在线97观看| 久久亚洲国产精品| 国产精品sss在线观看av| 亚洲欧洲日产国码无码久久99| 久久精品网站免费观看| 一本一道人人妻人人妻αv| 欧美情侣性视频| 在线日本制服中文欧美| 17c国产在线| 午夜日韩在线观看| 国产黄色片在线观看| 91网在线免费观看| 国产精品视频| av最新在线观看| 亚洲国产精品一区二区久| 亚洲天堂一区二区| av中文字幕av| 久久精品夜色噜噜亚洲a∨| 国产精品玖玖玖| 4k岛国日韩精品**专区| 国产精品国产一区| 182在线视频| 欧美日韩aaaaaa| 韩日毛片在线观看| 自拍偷拍视频在线| 91色视频在线| 亚洲av无码专区在线| 国产精品第8页| 尤物在线精品| 亚洲精品自拍视频在线观看| 亚洲加勒比久久88色综合| 日韩欧美三区| 国产男女无遮挡| 亚洲欧美激情小说另类| 国产区视频在线| 国内外成人免费视频| 国产精品一级二级三级| www.久久视频|