精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

OpenAI 開源模型 gpt-oss 是在合成數據上訓練的嗎?一些合理推測 原創

發布于 2025-8-21 16:07
瀏覽
0收藏

編者按: OpenAI?首次發布的開源大模型?gpt-oss?系列為何在基準測試中表現亮眼,卻在實際應用后發現不如預期?

我們今天為大家帶來的這篇文章,作者推測 OpenAI 的新開源模型本質上就是微軟 Phi 模型的翻版,采用了相同的合成數據訓練路線。

本文給出了支持這個推測的三個理由:首先,作者通過對比 Phi 模型系列的發展歷程,揭示了基于合成數據訓練的模型普遍存在“基準測試表現優異但實際應用效果不佳”的現象;其次,文章探討了 OpenAI 選擇這一技術路線的核心動機 —— 安全考量,指出大型組織發布開源模型時面臨的聲譽風險,以及合成數據在提升模型安全性方面的獨特優勢;最后,作者結合微軟前 GenAI 研究副總裁 Sebastien Bubeck 加入 OpenAI 這一人事變動,推測 gpt-oss 模型的技術基因很可能直接承襲自 Phi 系列。

本文系原作者觀點,Baihai IDP 僅進行編譯分享

作者 | Sean Goedecke

編譯 | 岳揚

OpenAI 不久前發布了其首個開源1大語言模型,名為 gpt-oss-120b 和 gpt-oss-20b。你可以在這里[1]與它們進行對話。這些模型好嗎?嗯,完全取決于你的需求。它們在某些基準測試[2]上表現優異(否則 OpenAI 根本不會發布),但在其他基準測試中卻表現得異常糟糕,比如 SimpleQA。

有些人非常喜歡這些模型[3],而推特上另一些人則完全不買賬[4-5]。據我觀察,這些模型技術上過硬,但缺乏大量領域外的知識:例如,它們擁有廣博的科學常識,卻對流行文化知之甚少。這些模型在實際應用中的價值還需六個月方能見分曉,但我預測這些模型最終會歸類于“在基準測試中的表現遠強于在真實任務中的表現”之列。

01 Phi 模型與在合成數據上訓練模型

2024 年,Sebastien Bubeck 領導了微軟開源模型系列 Phi 的開發2。這些模型的創新點在于完全采用合成數據進行訓練:不同于從書籍或互聯網中直接抓取的文本數據,而是使用其他語言模型生成的文本或經過人工精心編寫的教材內容。合成數據比常規數據獲取成本更高 —— 不是免費下載數 TB 數據就能解決,而是需要付費生成每個 token。這種方法的代價是必須為每個 token 的生成付費,優勢則是能完全掌控訓練數據的品質。 若完全用高質量的合成數據和人工編寫的數據訓練模型,結果會如何?

事實證明,這類模型在基準測試中表現會十分出色,但在實際應用中的表現卻令人失望。梳理業界對每代 Phi 模型的評價可發現一個相同的模式:驚艷的測試分數[6],高漲的市場熱情,但實際性能卻遠低于基準測試所顯示的水平[7]。

我認為之所以會出現這些驚艷的基準測試結果,是因為模型非常適合針對特定任務進行訓練 —— 畢竟大部分訓練數據由開發者自主生成。若采用合成數據訓練模型卻不生成與主流測試場景高度匹配的數據集,那可就太愚蠢了。但這種“應試訓練(teaching for the test)”必然導致其表現遜色于基于廣泛數據訓練的語言模型,并且這些模型也可能只是偶然在基準測試中表現良好。

為什么我要談論 Phi 模型?2024 年底,Sebastien Bubeck 離開微軟[8]加入 OpenAI。雖然 gpt-oss 模型的研發陣容尚未披露,模型卡片(model card)[9]也未詳述預訓練細節,但我確信 Sebastien Bubeck 參與了這個項目,且這些模型基于經過嚴格篩選或完全合成的數據集訓練而成。

02 合成數據更安全

為何 OpenAI 明知 Phi 式的模型在基準測試的表現優于實際應用中,還堅持要開發?原因很可能與微軟持續研發 Phi 系列模型相同:安全。 對大型組織而言,發布開源模型猶如在走鋼絲 —— 模型一旦公開,企業聲譽便與之永久綁定,成千上萬的研究人員會瘋狂地嘗試對其進行微調以移除安全防護措施(safety guardrails)。

雖然這一點鮮少被公開討論,但當前微調小型語言模型的主要需求的確是色情角色扮演(erotic role-play),且市場需求旺盛。任何本地部署模型的線上社群中,半數內容涉黃。

若發布一個常規的閉源模型并限制在自有基礎設施內運行,用戶便無法微調。即使出現一些問題,也能隨時更新模型。但開源模型一旦發布便永久失去控制。

使用合成數據(或教科書等高度可控的數據)訓練能大幅提升模型的安全性。開發者可以隨意生成大量“您要求執行 X 操作,但作為一個負責任的模型,我拒絕執行”的合規響應。只要訓練數據不包含顛覆性的或有害的內容,模型就不會習得此類行為(至少目標是如此)。

對 OpenAI 而言,開發一款 Phi 風格的模型用于開源發布想必極具吸引力。他們需要既能超越中國開源模型基準分數,又不會因行為失范而引發新丑聞的產品[10]。不同于 Meta,他們的開源模型無需真正出色,因為其核心業務始終在于閉源模型。

這正是我判斷 OpenAI 為新 gpt-oss 模型選擇合成數據路線的原因。無論結果如何,它們本質上就是披著 gpt 馬甲的 Phi-5 和 Phi-5-mini。


1 實為開放權重(open weight),而非開源,因為其模型權重可自由獲取,但訓練數據與代碼未公開。當然 OpenAI 曾發布 GPT-2 等開放權重模型,但此次才是首批真正意義上的開放權重模型。

2 我在微軟旗下 GitHub 從事 AI 研究工作,但對所述內容完全不知道內部情況。本文內容完全憑借公開信息撰寫。

END

本期互動內容 ??

?如果 GPT-OSS 是在合成數據上訓練的,那么它在基準測試和實際應用中表現差異這么大,你覺得是合成數據的局限性,還是測試標準本身有問題?

文中鏈接

[1]https://gpt-oss.com/

[2]https://cdn.openai.com/pdf/419b6906-9da6-406c-a19d-1bb078ac7637/oai_gpt-oss_model_card.pdf

[3]https://simonwillison.net/2025/Aug/5/gpt-oss/

[4]https://x.com/corbtt/status/1952868822891012241

[5]https://x.com/vikhyatk/status/1952863413845275132

[6]https://arxiv.org/abs/2404.14219

[7]https://news.ycombinator.com/item?id=40128351

[8]https://www.reuters.com/technology/microsofts-vp-genai-research-join-openai-2024-10-14/

[9]https://cdn.openai.com/pdf/419b6906-9da6-406c-a19d-1bb078ac7637/oai_gpt-oss_model_card.pdf

[10]https://www.seangoedecke.com/ai-sycophancy

本文經原作者授權,由 Baihai IDP 編譯。如需轉載譯文,請聯系獲取授權。

原文鏈接:

https://www.seangoedecke.com/gpt-oss-is-phi-5/

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
標簽
收藏
回復
舉報
回復
相關推薦
日韩理论电影| 国模雨婷捆绑高清在线| 秋霞午夜鲁丝一区二区老狼| 一区二区亚洲欧洲国产日韩| 久久国产精品国产精品| 超碰在线caoporen| 91天堂素人约啪| 91精品久久久久久久久久另类| 五月天激情丁香| 日韩精品免费一区二区夜夜嗨 | 欧美成人精品3d动漫h| 草b视频在线观看| 黄色av网站在线| 国产一区在线精品| 秋霞av国产精品一区| 国产精品18在线| 色天下一区二区三区| 欧美日韩国产小视频| 欧美一级片免费播放| 五月香视频在线观看| av在线一区二区| 成人免费午夜电影| 亚洲国产精品无码久久久| 综合色一区二区| 国产一区二区三区日韩欧美| 国产51自产区| 成人网av.com/| 一本大道av一区二区在线播放| 欧洲美女和动交zoz0z| 久久99久久| 成人av影院在线| 亚洲永久在线观看| 中文字幕日本视频| 亚洲资源av| 九九热视频这里只有精品| 人妻体内射精一区二区| 爱高潮www亚洲精品| 91精品蜜臀在线一区尤物| 免费看a级黄色片| 在线手机中文字幕| 国产欧美一区二区精品性色超碰| yy111111少妇影院日韩夜片| 一区二区三区日| 欧美aaa在线| 国产精欧美一区二区三区| 久久久久久蜜桃| 欧美日本国产| 色偷偷噜噜噜亚洲男人| 人人妻人人澡人人爽| 日韩电影不卡一区| 亚洲精品v欧美精品v日韩精品 | 国产成人综合在线播放| 国产欧美日韩免费看aⅴ视频| 午夜精品一区二| 蜜桃av一区| 日韩av手机在线看| 加勒比在线一区| 日韩电影在线观看电影| 国产精品69av| 中文字幕你懂的| 裸体一区二区三区| 成人黄色片在线| 国产内射老熟女aaaa∵| 国产乱人伦精品一区二区在线观看| 成人黄色影片在线| 国产农村老头老太视频| 国产乱人伦偷精品视频不卡| 97碰碰视频| 欧美77777| 久久奇米777| 欧美激情www| 91最新在线| 亚洲图片激情小说| 国产 欧美 日本| 91禁在线看| 色综合久久久久网| 国内自拍视频一区| 91麻豆精品国产综合久久久| 欧美精品成人一区二区三区四区| 网站在线你懂的| 超碰97久久| 亚洲欧美三级伦理| 国产人与禽zoz0性伦| 欧美有码视频| 97精品国产97久久久久久| 日韩美一区二区| 久久99久久久久久久久久久| 国产不卡一区二区三区在线观看| 日韩中文字幕免费在线观看| 久久久99免费| 青青草视频在线视频| 日韩脚交footjobhd| 欧美日韩综合不卡| 无码国产精品一区二区免费式直播 | 国产综合自拍| 国产成人aa精品一区在线播放| 又污又黄的网站| 成人一区二区视频| 青青草原亚洲| 爆操欧美美女| 欧美午夜无遮挡| 免费黄频在线观看| 亚洲肉体裸体xxxx137| 久久精品国产亚洲| 亚洲第一精品在线观看| 国内精品国产三级国产a久久| 国产一级二级三级精品| 日韩av中文| 日韩欧美第一页| 久久久精品视频国产| 免费一区二区| 欧美精品video| 中文字幕乱码视频| av不卡一区二区三区| 一本久道久久综合| 91精品论坛| 亚洲成人精品久久| 天海翼在线视频| 日韩av中文字幕一区二区三区| 99re6在线| 蜜桃视频网站在线观看| 色视频成人在线观看免| 中文字幕在线视频播放| 亚洲精品中文字幕乱码| 国产精品久久久91| 四虎精品在永久在线观看| 亚洲精品视频在线看| 蜜臀av免费观看| 久久不见久久见免费视频7| 色综合天天综合网国产成人网| 国产裸体美女永久免费无遮挡| 99久久精品免费观看| 久久久久久av无码免费网站下载| 亚洲欧美在线综合| 中文字幕av一区二区| 91久久国产综合久久91| 95精品视频在线| 欧美成人高潮一二区在线看| 大陆精大陆国产国语精品 | 久久精品视频免费在线观看| 日韩黄色在线观看| 免费一区二区三区在在线视频| 国产网红女主播精品视频| 欧美日韩精品免费| 一二三四国产精品| 日韩 欧美一区二区三区| 成人三级视频在线观看一区二区| 欧美精品日韩少妇| 欧美日韩二区三区| 天天操天天摸天天舔| 亚洲自啪免费| 欧美日韩成人一区二区三区 | 欧美午夜视频一区二区| 亚洲啪av永久无码精品放毛片| 欧美私人啪啪vps| 俄罗斯精品一区二区| 欧美性爽视频| 亚洲第一精品电影| 91九色丨porny丨肉丝| 97久久久精品综合88久久| 免费在线a视频| 久久99蜜桃| 国产精品亚洲激情| 国产黄色在线观看| 欧美日韩免费视频| 麻豆视频在线免费看| 丁香婷婷综合五月| 日韩在线综合网| 国产探花一区在线观看| 国产精品视频网站| 麻豆传媒在线免费看| 日韩精品中文字幕一区二区三区 | 国产美女一区视频| 亚洲国产精品一区二区久| 在线免费黄色av| 中文字幕欧美三区| 欧美专区第二页| 亚洲片区在线| 欧美深深色噜噜狠狠yyy| 五月激情久久| 不用播放器成人网| 天天干天天爱天天操| 91极品美女在线| 欧美性生交大片| 成人午夜在线免费| 男女无套免费视频网站动漫| 欧美一区二区三区久久精品| 精品欧美国产一区二区三区不卡| 三上悠亚亚洲一区| 欧美久久精品一级黑人c片| 香蕉视频成人在线| 欧美高清www午色夜在线视频| 久久久国产成人| 国产午夜精品一区二区| 三级黄色片播放| 老司机精品导航| 久久人妻无码一区二区| 精品一区在线| 懂色一区二区三区av片| 日韩一区二区三区在线免费观看 | 97欧美成人| 久久免费视频在线观看| 91网页在线观看| 亚洲第一综合天堂另类专| 中文字幕在线观看1| 亚洲小说欧美激情另类| 日本在线观看网址| 久久久青草青青国产亚洲免观| 亚洲怡红院在线| 亚洲一区黄色| 中文字幕日韩精品无码内射| 国产不卡av一区二区| 97超级碰碰| 日本免费成人| 日韩暖暖在线视频| sm捆绑调教国产免费网站在线观看| 日韩在线观看免费全集电视剧网站| 亚洲欧美丝袜中文综合| 欧美一区二区三区日韩视频| 精品人妻一区二区三区潮喷在线 | 日韩在线免费av| 欧美黄色小说| 精品成人在线观看| 国产原创中文av| 日本电影亚洲天堂一区| 91精品国产高潮对白| 亚洲欧美电影一区二区| 国产精品无码无卡无需播放器| 9i在线看片成人免费| 久久国产免费视频| 国产精品一二三| 国产大片一区二区三区| 蜜臀99久久精品久久久久久软件| 国产日产欧美视频| 国产亚洲精品久久久久婷婷瑜伽| 国内少妇毛片视频| 欧美网站在线| 黄色片免费在线观看视频| 亚洲xxx拳头交| 一区二区三区久久网| 青草国产精品| 亚洲黄色一区二区三区| 精品少妇av| 亚洲精品一区二区三区av| 国产剧情一区| 日韩性感在线| 日韩在线观看一区 | 粉嫩av四季av绯色av第一区| 激情久久免费视频| 91九色在线免费视频| 日韩亚洲精品在线观看| 波多野结衣久草一区| 日韩三级av高清片| 操一操视频一区| 国内露脸中年夫妇交换精品| 国产三区精品| 欧亚精品一区| 奇米视频888战线精品播放| 精品视频免费在线观看| 亚洲狠狠婷婷综合久久久| 久久久9色精品国产一区二区三区| 91社在线播放| 亚洲视频久久| 亚洲中文字幕无码不卡电影| 首页欧美精品中文字幕| 91欧美视频在线| 国产一区免费电影| 无码人妻一区二区三区精品视频| 国产.欧美.日韩| 玖草视频在线观看| 国产三级精品视频| 性生交大片免费全黄| 樱花影视一区二区| 成人免费区一区二区三区| 91黄色激情网站| 国产口爆吞精一区二区| 精品粉嫩aⅴ一区二区三区四区| 亚洲av片在线观看| 色伦专区97中文字幕| 青青草视频在线免费直播| 欧美性一区二区三区| 欧美aaa级| 国产精品免费一区二区三区在线观看| 国产精品香蕉| 亚洲午夜精品久久| 亚洲天堂久久| 三级在线视频观看| 国产成人精品一区二区三区四区| 毛茸茸多毛bbb毛多视频| 中文字幕中文乱码欧美一区二区| 免费一级特黄特色大片| 欧美性受xxxx黑人xyx| 不卡的日韩av| 一区二区成人精品| 免费在线看污片| 国产精品久久一区主播| 91精品久久久久久综合五月天| 欧美日韩最好看的视频| 狠狠综合久久| 777视频在线| 不卡欧美aaaaa| 欧美日韩色视频| 色综合久久久久综合99| 黄色小视频免费观看| 日韩视频中文字幕| 美女福利一区二区三区| 不卡一区二区三区四区五区| 色综合久久一区二区三区| 欧美日韩在线一| 国产精品综合视频| 妖精视频在线观看免费| 天天色图综合网| 国产极品久久久| 日日噜噜噜夜夜爽亚洲精品| 亚洲性受xxx喷奶水| 国产精品一区视频| 亚洲欧美网站在线观看| 久久99999| 久久久久久**毛片大全| 国产无码精品视频| 欧美一区二区三区免费| 亚洲天天影视| 国产精品久久久久久久9999| 午夜先锋成人动漫在线| 日韩精品一区在线视频| 国产在线麻豆精品观看| 在线观看日本黄色| 日本丰满少妇一区二区三区| 视频二区在线| 97热在线精品视频在线观看| 亚洲国产精品免费视频| 亚洲第一综合网站| 久久精品国产免费| 亚洲一级片在线播放| 在线免费观看视频一区| 免费毛片在线| 国产91精品在线播放| 免费看成人吃奶视频在线| 自慰无码一区二区三区| 99久久99久久免费精品蜜臀| 久久综合色综合| 精品欧美一区二区在线观看| 四虎影视国产在线视频| 岛国视频一区免费观看| 欧美激情一级片一区二区| 久久发布国产伦子伦精品| 亚洲欧美日韩久久| www.国产精品视频| 欧美黄色片在线观看| 这里视频有精品| 欧洲精品一区二区三区久久| 成人黄页毛片网站| 日韩免费一级片| 精品一区二区三区三区| 黄色综合网址| 日韩欧美亚洲日产国产| 看电视剧不卡顿的网站| 日韩福利小视频| 日韩精品中午字幕| 日韩精品极品| 日韩欧美一区二区三区四区| 另类中文字幕网| 亚洲欧美一区二区三区四区五区| 日韩欧美一区二区不卡| 97久久人人超碰caoprom| 久久精品aaaaaa毛片| 日本在线不卡一区| 少妇人妻丰满做爰xxx| 精品日韩成人av| 一级毛片久久久| 亚洲精品一区二区三区蜜桃久 | 色综合天天综合狠狠| 91精品国产91久久久久游泳池| 成人妇女免费播放久久久| 国产精品s色| 久久人人爽人人爽人人片| 在线免费观看日韩欧美| 尤物yw193can在线观看| 精品国产乱码久久久久久蜜柚| 久久精选视频| 成人在线观看小视频| 亚洲精品www久久久久久广东| 日韩和的一区二在线| 精品嫩模一区二区三区| 91亚洲午夜精品久久久久久| 亚洲图片小说视频| 久久久久久久香蕉网| av一区二区高清| a级大片免费看| 色综合久久天天| 在线看三级电影| 日韩欧美在线观看强乱免费| 国产精品影视在线观看| 在线永久看片免费的视频| 欧美精品一区在线播放| 国产伦一区二区三区| av影片在线播放| 欧美日韩在线电影| 国产99在线观看| 粉嫩av一区二区三区天美传媒|