精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

OpenAI發布新模型:o1系列模型,更像理科生的模型 精華

發布于 2024-9-14 13:34
瀏覽
0收藏

本來今天準備發一篇金融相關的Agent論文

結果一大早上,各大群就都開始流傳著各種聊天記錄

原來是凌晨OpenAI發布了新的 o1 系列模型(以下簡稱 o1模型或o1),所以迫不及待的找了些資料趕緊學習下。

OpenAI發布新模型:o1系列模型,更像理科生的模型-AI.x社區圖片

看上去,這個 o1 系列模型在數學、編碼、科學等一系列理科生擅長的事情上,表現比GPT4還好。

目前,各大微信群的討論大致分為兩種觀點:

? o1 太牛逼了,GPT5來了,AGI立馬到來!

? o1 這不就是個 Workflow + Agent嗎?

收集了各方的【小道消息】,其實就是是【X】上各種OpenAI發布的消息 + 微信群聊天記錄 + OpenAI官方文檔。

可以總結一下:

? o1模型最大的特點:輸出最終答案前,會進行深入思考,這種思考不是簡單的通過提示工程來注入的,而是通過強化學習實現的

? o1模型的尺寸不會很大,是個小尺寸大模型(證據來自OpenAI研究院 Jason Wei的X,如下圖),但是到底多小?不知道。

OpenAI發布新模型:o1系列模型,更像理科生的模型-AI.x社區圖片

緊接著英偉達科學家 Jim Fan 也發了消息,對 o1 模型做了一些解讀,我們匯總一下要點:

? 模型的大多數參數只是用來記憶事實,而推理核心不需要太多參數。可以從知識中分離出一個小的“推理核心”,這樣可以減少大量的預訓練計算。

? 大量計算由原來的訓練階段,轉移到了服務推理階段。

? o1在實際應用落地的難度遠比學術基準測評要更難,這一塊還有待后續大家進一步探索。

? o1模型也會像之前ChatGPT一樣,形成數據飛輪,催生更多訓練數據和模型的出現。

o1是不是GPT5?

目前,根據各方消息看來,o1并不是部分自媒體吹噓的GPT5。

至少從OpenAI官方文檔中,看不到任何描述能將GPT5和o1模型聯系在一起的。

o1算是strawberry / Q* 項目的一個產出。

OpenAI發布新模型:o1系列模型,更像理科生的模型-AI.x社區圖片

OpenAI發布新模型:o1系列模型,更像理科生的模型-AI.x社區圖片

雖然沒有被宣稱為GPT5,但是o1是一個不同于傳統的GPT3.5和GPT4的新范式。在OpenAI的開發者文檔中,我們可以發現,o1模型被單獨列為推理模型(Reasonging Models),這是否意味著之前 Altman 宣稱的將數據與推理引擎分離的構想已經實現,或者已經邁出實質性的一步?

這也與前面英偉達科學家 Jim Fan 提到的觀點相呼應:模型的大多數參數只是用來記憶事實,而推理核心不需要太多參數,可以從知識中分離出一個小的“推理核心”。

o1模型是不是一個Agentic Workflow?

這是今天很多群里充斥的觀點之一,在大家非常興奮的體驗了o1模型后,部分同學,包括一些自媒體也紛紛得出這樣的結論,甚至開始唱衰OpenAI。

比如,有的自媒體開始【大膽】的猜測:這次的草莓o1有可能是 gpt-4o 在進行一些微調/對齊后的 agent。

包括說:

這有沒有可能就是封裝了workflow而已?

在仔細閱讀了各種資料后,我的猜測, o1模型肯定不是 agent,原因如下:

1、o1是經過強化學習的推理模型

在官方文檔中,o1模型被定義為推理模型,而且是經過強化學習訓練的模型,使用了思維鏈進行推理。o1模型的一個顯著區別就是o1模型引入了一個成為推理token的概念,對用戶提出的問題,探索多種生成回答的方法,最后模型以一種被稱為可見token的方式輸出答案。

這種token的設計,也導致了一些與之前的模型的區別,比如:

  • ?實際生成的token數與系統返回的token數存在差異:甚至一個很簡單的問題,也會消耗大量token。比如,當回答一個簡單的提示詞“你好”的時候(雖然個人認為,這樣的提示詞并不是推理模型所擅長的),模型消耗了 400 多個token。PS:在OpenAI的官方文檔中,明確提出大家在使用o1模型的時候要預留窗口空間給推理token。比如下圖,當輸出長度超出了限制時,可見輸出就看不到了。

OpenAI發布新模型:o1系列模型,更像理科生的模型-AI.x社區圖片

?模型耗時增加:因為中間多了一個推理過程(多方式推理,可能通過一種類似MCTS的方法來進行最佳路徑搜索),所以模型輸出會比其他模型消耗更多的時間(如下圖)。

OpenAI發布新模型:o1系列模型,更像理科生的模型-AI.x社區圖片

2、沒有多模態、沒有系統提示詞、沒有工具調用、沒有stream輸出等等

如果o1只是一個Agent應用,那么為什么不把這些系統提示詞、工具調用、stream輸出加上?這些對OpenAI的工程師來說是個難題?咱們國內的組合式創新團隊都能做的事情,OpenAI居然做不了?

3、完全不同的提示詞策略

在OpenAI的官方文檔中,我們可以發現,OpenAI給出了針對推理模型的提示詞建議:

? 由于模型內部已經進行推理,過去的few shot或者zero shot cot(要求模型逐步思考)的提示詞技巧,可能并不會提升性能,反而可能會降低性能。

? 保持提示簡潔明了:模型擅長理解并回應簡短而清晰的指令,無需過多指導。

? 利用分隔符提高清晰度:使用三重引號、XML標簽或小節標題等分隔符,明確區分輸入的不同部分,幫助模型更準確地解讀。

? 在檢索增強生成(RAG)中限制額外上下文:提供額外上下文或文檔時,只包含最相關的信息,以免模型的回應過于復雜。

綜上,o1模型應該并不是一個Agentic Workflow應用,而是一個確確實實的新的模型范式。而且這應該只是OpenAI在這個事情上踏出的第一步(也許我們從代號1就可以看出,重新命名,而不是繼承),而不是最后一步,目前的o1模型也不打算取代GPT4\GPT4-o等模型的地位。

o1模型到底強還是弱?

答案是,o1肯定強,但是也沒有強到無與倫比。

目前流傳的各種體驗,測試結果來看,o1肯定是強的,特別是在需要推理的STEM領域(STEM是Science、Technology、Engineering、Mathematics 四個英文單詞首字母的縮寫)。

各種數據我就不羅列了,應該鋪天蓋地都是。

但是o1仍然是不強的,比如,o1還是無法完全正確回答一些問題,比如大家都在嘗試問他9.11和9.8到底誰大的問題。

這側面說明,即使o1是一個推理引擎,但他始終還是利用語言來模擬自然世界,與規則的方法不一樣。

所以,對于o1模型,我們需要客觀的看待,即使o1模型很強,但是也仍然是有幻覺的。

OpenAI發布新模型:o1系列模型,更像理科生的模型-AI.x社區圖片

當然,有人我們未來可能遇到號稱比 o1 強69倍的GPT-5模型,但是如果范式不變,我想仍然是無法從根本上解決 9.11和9.8 誰大這類問題的。

為什么說o1是一個更像理科生的模型?

不知道大家有沒有關注到,OpenAI的文檔里,花了很大篇幅描述o1模型在STEM和安全方面的評估。

以及,在 Greg Brockman 發的消息里可以看到,OpenAI是認可 o1 模型實際上是使模型從 System1 向 System 2 靠近的動作(之所以說靠近,是因為個人認為System1和System2邊界并不明顯)。

OpenAI發布新模型:o1系列模型,更像理科生的模型-AI.x社區圖片

在之前的論文里我們也討論過,System1和System2的區別在于:

System1:快速,不加思考、不做計算、僅憑直覺就做出判斷。比如,當我們回答1+1這個問題的時候,我們的大腦可以不加思考的回答出等于2。所以系統一的特點是:快思考、熱啟動、直覺判斷。

System2:速度,需要做復雜的計算、推理,但回答準確度高。比如,當我們回答123乘以879的時候,我們無法通過我們的快思考來回答,我們需要調用大腦的計算模塊,對這個問題進行復雜的計算后才能回答。所以系統二的特點是:慢思考、啟動慢、耗費能量高、判斷準確。

而o1則是試圖使用內置的CoT來引導模型生成更加準確的答案,而需要這些嚴格推理邏輯的則是STEM里的這幾門學科。所以我們可以認為,相比過去的大語言模型(真快,這才2年不到,就可以說過去了),o1更加像一個理科生思考。這并不是說o1是理科生,而是說,大語言模型過去更像一個文科生,特別是zero shot的時候,而現在的o1則是在彌補理科生這個短板。

是否要馬上把o1模型用起來?

對于這塊,我的答案是謹慎!

1、模型仍不完善

o1模型并非一個成熟的產品,這點從官方文檔、X上的討論都可以看得出。目前還處于beta狀態,而且各種功能的缺失,比如System Prompt、tool調用、參數設置等等。以及 o1-mini 所涉及的知識、領域仍然比較有限。

2、推理速度限制

雖然o1模型是個新模型,是新一代模型范式,是大家眼中的未來。但是o1模型因為自身設計的原因,會導致比其他模型消耗更長的時間。所以在很多應用中,特別是對時間敏感的應用,需要謹慎考慮:我們的產品、應用能否接受這樣的響應時間?

3、也許更高的成本

因為o1模型在推理過程中,會消耗大量的推理token,很多人稱之為OpenAI的扣費陷阱。當然,o1模型也帶來一個新的優勢,就是我們可以不用傳few shot案例,也許可以減少一些token的輸入,但是這一增一減,到底是增加了成本還是降低了成本,目前還不是特別明朗,推薦大家多多測試后,再做定論。

4、新的提示詞結構

o1模型因為設計的原因,帶來了一些新的提示詞范式,過去的提示詞在 o1模型上不一定適用了。

比如過去的 few shot 或者 COT 提示詞,根據官方建議,這些技巧不僅不能帶來收益,還會降低效果。


所以,綜上,是否要使用o1模型來替換我們現有應用的模型,我們需要謹慎對待,需要做充分的測試評估。這與過去的模型參數增加不一樣,這次是一個范式的變化。

雖然有這么多不利因素,但是有利因素也是顯而易見:推理能力增強了,過去做不到、或者無法實現的應用,也許會成為可能

會有新的一輪大模型風潮嗎?

過去,ChatGPT的出現,隨之而來的是合成數據帶來了一大批新的模型出現。那么這次,還會是這樣嗎?

不敢做非常確定性的答復,但是我想這次可能有點不一樣。

這次帶來的合成數據不會那么容易,按照OpenAI官方文檔,推理token是不可見的,所以至少推理token大家應該是拿不到的。那么,后續的合成數據訓練新模型這條路看上去被堵死了。

但是,事情也不是絕對的。一件事情最難的部分往往是“證明這件事可行”,所以OpenAI證明了這個路徑是可行的,也讓大家關注到了這個新的路徑,即使沒有合成數據的幫助,但是也會有其他辦法來貢獻這些數據。期待開源社區進一步的表現。

本文轉載自??大語言模型論文跟蹤??,作者: HuggingAGI ????

收藏
回復
舉報
回復
相關推薦
91黄色在线观看| 久久亚洲免费视频| 欧美福利视频在线| 成人在线视频免费播放| 欧美大片高清| 亚洲青青青在线视频| 精品欧美一区二区在线观看视频| 日韩黄色在线播放| 91精品国产福利在线观看麻豆| 欧美xxxx老人做受| 国模杨依粉嫩蝴蝶150p| 含羞草www国产在线视频| 国产suv精品一区二区三区| 91a在线视频| 波兰性xxxxx极品hd| 精品精品精品| 欧美美女直播网站| 男人日女人逼逼| 日本欧美在线视频免费观看| 99亚偷拍自图区亚洲| 国产一区二区色| 中文字幕一区二区三区手机版 | av电影成人| 男人天堂视频在线| 在线视频观看日韩| www.亚洲成人| 国产jk精品白丝av在线观看 | 精品国产乱码久久久久久久软件| 国产又黄又猛的视频| 都市激情久久综合| 中文字幕精品一区| 精品国产一二| 超碰福利在线观看| 麻豆久久一区二区| 欧美性在线视频| 免费看一级一片| 视频在线不卡免费观看| 亚洲欧美制服丝袜| 北岛玲一区二区| 亚洲精品一区二区三区中文字幕| 欧美色综合网站| 热久久精品国产| 天堂网在线最新版www中文网| 亚洲综合激情小说| 91嫩草国产丨精品入口麻豆| 日本蜜桃在线观看| 亚洲国产激情av| 欧美一区二区三区四区在线观看地址| 丰满人妻一区二区三区无码av| 国内精品久久久久影院色| 国产精品国模在线| 精品国产乱子伦| 久久午夜精品一区二区| 欧美在线日韩在线| 久久黄色精品视频| 亚洲在线免费| 欧美亚洲日本网站| 日韩欧美成人一区二区三区| 国产亚洲一级| 欧洲日本亚洲国产区| 久久夜色精品国产噜噜亚洲av| 国产精品日韩久久久| 91禁外国网站| 成人毛片在线播放| 久色成人在线| 国产精选久久久久久| 一区二区www| 国产精品一级黄| y111111国产精品久久婷婷| 亚洲国产精品欧美久久| 成人亚洲一区二区一| 国产精品嫩草在线观看| 欧美一级特黄aaaaaa| 91小视频在线免费看| 久久综合九色综合久99| 搞黄视频在线观看| 成人免费在线视频观看| 青青青青在线视频| 亚洲电影观看| 欧美日韩aaa| 一个人看的视频www| 成人看片黄a免费看视频| 亚洲第一精品电影| av网站免费在线看| 五月久久久综合一区二区小说| 欧美成人午夜激情| 中文字幕一区二区三区精品| 日韩精品免费专区| 91精品久久久久久蜜桃| 污视频网站免费观看| 久久久99久久| 日韩精品一区二区三区电影| gogo久久| 欧美日本在线一区| 国产精品二区视频| 欧美日韩精品一区二区视频| 久久中文字幕一区| 成人免费a视频| 国产一区二区精品在线观看| 久久综合久久久| www在线免费观看视频| 欧美日韩亚洲高清| 亚洲免费成人在线视频| 丝袜av一区| 另类视频在线观看| 日韩三级一区二区| 国产一级精品在线| 欧美日韩免费高清| 久草免费在线色站| 欧美男人的天堂一二区| 亚洲一区二区乱码| 亚洲情侣在线| 国产精品成人在线| 亚洲精选一区二区三区| 国产精品毛片a∨一区二区三区| 欧美国产日韩激情| 午夜精品久久久久久毛片| 亚洲精品97久久| 伊人在线视频观看| 日本欧美一区二区三区乱码| 国语精品中文字幕| 青草在线视频| 91精品国产综合久久香蕉麻豆| 中文字幕一区二区人妻在线不卡| 一区二区电影| 国产精品私拍pans大尺度在线| 午夜视频福利在线| 亚洲成人av一区二区| 中文 日韩 欧美| 欧美在线观看视频一区| 欧美一级淫片播放口| 欧美 日韩 国产 精品| 亚洲欧洲日韩综合一区二区| 国语对白做受xxxxx在线中国 | 91中文字幕在线观看| 国产69精品久久app免费版| 日韩欧美亚洲一二三区| 国产在线不卡av| 影音国产精品| 成人精品水蜜桃| 在线欧美三级| 日韩视频永久免费| 日韩高清dvd碟片| 国产在线精品国自产拍免费| 伊人av成人| 成人影院在线免费观看| 亚洲欧美日韩中文在线| av一级在线观看| 久久久久久久一区| 热久久精品国产| 波多野结衣的一区二区三区| 国产成人午夜视频网址| 国产三级视频在线| 欧美专区亚洲专区| 国产又粗又长又硬| 国内不卡的二区三区中文字幕| 在线观看成人av电影| 99久久99九九99九九九| 精品国产一区二区三区在线观看| 免费在线观看av的网站| 中文字幕欧美国产| 亚洲一级免费在线观看| 亚洲澳门在线| 99九九电视剧免费观看| 97人澡人人添人人爽欧美| 亚洲成人教育av| 六月丁香激情综合| 欧美国产欧美综合| 亚洲欧美日韩一二三区| 欧美体内she精视频在线观看| 国产传媒一区二区| 久草在线资源福利站| 亚洲香蕉成人av网站在线观看| 一区二区小视频| 亚洲日本青草视频在线怡红院 | 久久亚洲天堂网| 国产拍欧美日韩视频二区| mm131亚洲精品| 在线精品小视频| 国产女人水真多18毛片18精品| 亚洲色图官网| 久久精品这里热有精品| 免费av网站在线播放| 色婷婷久久久久swag精品| 国精产品久拍自产在线网站| 成人免费视频一区| 日本成人中文字幕在线| 欧美一区视频| 欧美伦理一区二区| 国产乱码精品一区二区三区亚洲人| 欧美激情精品久久久久久蜜臀 | 久久精品人人做人人爽| 动漫av一区二区三区| 色欧美日韩亚洲| 欧美三级在线免费观看| 91丨九色丨国产丨porny| 国产一级片自拍| 亚洲经典在线看| 亚洲一区二区三区精品动漫| 国产精品视屏| 成人福利视频网| 蜜桃麻豆影像在线观看| 精品国产一区久久久| 色资源在线观看| 欧美一区永久视频免费观看| 免费黄色av片| 亚洲一二三四区| 色噜噜噜噜噜噜| 不卡免费追剧大全电视剧网站| jizz大全欧美jizzcom| 亚洲视频二区| 50度灰在线观看| 欧美一级精品片在线看| 国严精品久久久久久亚洲影视| 欧美成人ⅴideosxxxxx| 国产精品成人午夜| 亚洲日本久久久| 日韩高清欧美激情| 日本中文字幕在线视频观看| 成人高清电影网站| 激情五月综合色婷婷一区二区| 成人毛片免费| 韩国欧美亚洲国产| 黄av在线播放| 在线精品国产欧美| 日韩在线免费播放| 精品福利一二区| h片在线免费看| 欧美日韩中文国产| 波多野结衣视频网站| 亚洲综合激情另类小说区| 久久精品在线观看视频| 国产日韩综合av| 国产精品久久不卡| 成人国产电影网| 四虎国产精品免费| 国产麻豆日韩欧美久久| 天天干天天综合| 爽好久久久欧美精品| 免费看一级大黄情大片| 精品动漫3d一区二区三区免费版| 91九色国产ts另类人妖| 国产成人精品亚洲午夜麻豆| 成人乱色短篇合集| 丝袜美腿一区| 91大神福利视频在线| 日韩av激情| 久久精品国产亚洲一区二区 | 国内欧美视频一区二区| 少妇人妻互换不带套| 乱人伦精品视频在线观看| 熟女少妇在线视频播放| 一区二区动漫| 国产精品后入内射日本在线观看| 亚洲啪啪91| 日韩av中文字幕第一页| 影音先锋亚洲一区| 五十路熟女丰满大屁股| 亚洲久久在线| 日本www在线播放| 校园春色综合网| 国产成人精品无码播放| 免费在线欧美视频| 亚洲a级黄色片| 国产精品一区二区黑丝| 极品人妻一区二区| 成人午夜免费av| 大尺度做爰床戏呻吟舒畅| 99精品国产高清在线观看| 日韩av影片| 国产91精品不卡视频| 96av在线| 欧美亚洲国产日本| 日韩免费福利视频| 国产精品久久久久久久久久久久 | 日韩av免费在线看| 精品国产免费人成网站| 4p变态网欧美系列| 久久野战av| 成人精品一区二区三区电影黑人| 日韩精品一区二区三区中文字幕 | 欧美禁忌电影网| 亚洲午夜精品福利| 国产精品大片| 国产精品亚洲二区在线观看| 蜜臀久久久久久久| 57pao国产成人免费| 77thz桃花论族在线观看| 91爱视频在线| 精品视频在线一区二区在线| 91久色国产| 蜜乳av综合| 无码毛片aaa在线| 国产日韩欧美高清免费| 性刺激的欧美三级视频| 国产盗摄一区二区三区| 黄色在线观看av| 尤物av一区二区| 日韩一级片中文字幕| 日韩一区二区电影网| 四虎影院在线播放| 美乳少妇欧美精品| 日韩三级影视| 国产精品久久7| 日韩精品一区二区三区免费观看| 成人免费在线视频播放| 视频一区二区三区在线| 性猛交╳xxx乱大交| 国产嫩草影院久久久久| 国产精品成人网站| 欧美日韩国产一级片| 深夜福利视频在线观看| 欧美另类第一页| 成人国产综合| 久久青青草综合| 韩日精品在线| 男生操女生视频在线观看| 久久综合国产精品| 久青草视频在线观看| 911精品产国品一二三产区| 黄色美女网站在线观看| 国内外成人免费激情在线视频| 国产精品xnxxcom| 视频二区一区| 久久成人国产| 9.1成人看片| 亚洲一区视频在线| 国产精品久久久久久久久毛片| 亚洲欧美另类人妖| 精品极品在线| 国产青春久久久国产毛片| 女人天堂亚洲aⅴ在线观看| 色噜噜狠狠一区二区| 中文字幕不卡在线观看| 九一国产在线观看| 日韩成人在线视频网站| 丁香花在线影院| 99r国产精品视频| 一区二区蜜桃| 男生和女生一起差差差视频| 综合自拍亚洲综合图不卡区| 在线观看中文字幕码| 欧美人在线视频| 97视频在线观看网站| 国产91精品久久久| 成人在线视频你懂的| 最新不卡av| 九九精品视频在线看| 天天干天天舔天天操| 日本久久一区二区| 精品资源在线看| 国产精品99久久久久久久久久久久| 欧美黑人巨大videos精品| www插插插无码视频网站 | 国产成人久久久精品一区| 亚洲黄色录像| 精品久久久久久久免费人妻| 国产亚洲欧美日韩日本| 亚洲午夜在线播放| 按摩亚洲人久久| **日韩最新| 成人在线视频一区二区三区| 国产成人鲁色资源国产91色综| 免费在线观看av网址| 亚洲а∨天堂久久精品喷水| 欧美另类老肥妇| 欧美精品亚洲| 另类小说视频一区二区| 乱h高h女3p含苞待放| 日韩欧美一区二区久久婷婷| 好看的中文字幕在线播放| 久久久精品有限公司| 蜜臀av一区二区在线免费观看 | 精品一区二区三区在线| av在线网址导航| 亚洲伊人色欲综合网| 香蕉视频黄在线观看| 国产精品男人的天堂| 91精品一区国产高清在线gif| 91精产国品一二三| 疯狂做受xxxx欧美肥白少妇| 成人欧美亚洲| **亚洲第一综合导航网站| 在线综合亚洲| 少妇的滋味中文字幕bd| 日韩欧美高清一区| 美女av在线免费看| 亚洲欧美精品在线观看| 丁香五精品蜜臀久久久久99网站| 亚洲免费在线观看av| www.xxxx精品| 美女午夜精品| 亚洲天堂2018av| 午夜欧美视频在线观看| 中文字幕在线视频区| 国产欧美亚洲日本| 日本免费新一区视频| 天堂资源在线播放| 在线视频中文亚洲| 国产三级精品三级在线观看国产|