精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

六個問題帶你看懂什么是理工科學霸-OpenAI o1！

發布于 2024-9-13 11:39

瀏覽

0收藏

這篇主要會回答下面的問題（too long，don't read）：

什么是OpenAI o1？——一個擅長數學物理化學生物編程等問題的理科學霸大模型
OpenAI o1最大的技術特征是什么？——RL訓練和推理，在傳統COT之外隱藏了一個很長的內在COT，滿足scaling law
OpenAI o1到底有多強？——斷崖碾壓GPT4-o，達到人類競賽選手，以及博士生水平。
人們更喜歡GPT4-o還是OpenAI o1?——文科方面o1沒有優勢，理工科方面碾壓GPT4-o
OpenAI o1的安全性怎么樣？—— 相比4o優勢明顯，更容易教會模型人類價值觀和原則
OpenAI o1為什么要向用戶隱藏內在思維過程？——為了安全性和用戶體驗（不想讓大家蒸餾它的內在思維過程作為訓練數據）

知乎：https://zhuanlan.zhihu.com/p/719859500

PS：“9.11和9.8誰大”的這個問題OpenAI o1依然存在問題！！！OpenAI o1模型是否被過譽，讓子彈再飛一會！

什么是OpenAI o1？

OpenAI o1（后面簡稱o1）是OpenAI在2024.9.12號發布的最新大模型，主要針對的任務是復雜任務推理，比如競賽難度的編程問題，奧賽難度的數學問題等。

參考OpenAI原始介紹: https://openai.com/index/learning-to-reason-with-llms/

OpenAI o1最大的技術特征是什么？

在訓練階段，會通過強化學習，讓o1完善其思維鏈并優化所使用的策略。例如：識別并糾正錯誤，將復雜步驟拆分為簡單步驟，當前方法不work時，換一種方法

在推理階段，模型同樣會在呈現給用戶的cot之外，做一個更深的的所謂的long internal chain of thought，所以推理時間會更長，相當于COT套娃了，給COT再加一個COT（猜測是把MCTS搜索過程序列化了，case放在文末）。

六個問題帶你看懂什么是理工科學霸-OpenAI o1！-AI.x社區

值得注意的是，這次OpenAI依然主打了他們一直信奉的Scaling Law，在訓練和測試時的時間都能和性能形成對數線性關系。

OpenAI o1到底有多強？

效果不用多說了，跟GPT4-o已經是斷崖式差距了，在最難的數學，code，物理化學生物等benchmark上遙遙領先。

在全美高中生數學競賽AIME上，o1能達到74分（GPT4-o僅有12分），如果采樣1000次，結合reward model加權投票能到93分，能排進全國前500名，超過USA Mathematical Olympiad的晉級分數線；
在GPQA，一個關于物理，化學和生物的智力測試上，OpenAI招募了一群相關領域有博士學位的專家和o1同臺競技， o1能夠在GPQA-diamond questions.上超過這群專家。
在視覺感知能力后方面，o1 在 MMMU 上取得了 78.2% 的分數，成為第一個與人類專家媲美的模型。

六個問題帶你看懂什么是理工科學霸-OpenAI o1！-AI.x社區

值得注意的是，OpenAI在o1的基礎上加強了模型的代碼能力，以o1為初始化又訓了一個o1-IOI，用于參加2024年的國際奧林匹克信息競賽（2024 International Olympiad in Informatics），在和人類選手相同的條件下，在10h內解決6道非常難的競賽問題，每個問題最多允許提交50次。最終，o1-IOI能獲得一個216分的分數，在放開提交次數后，o1-IOI能獲得362.14，超過了金牌線。這種和人類頂尖選手同臺競技，才是最能反映模型能力的benchmark吧。在CodeForce上，打出了驚人的1807分。

六個問題帶你看懂什么是理工科學霸-OpenAI o1！-AI.x社區

人們更喜歡GPT4-o還是OpenAI-o1?

OpenAI測試了在不同領域的問答上，用GPT4-o和o1匿名回答，大家投票，結果顯示，o1只是在理工科方面顯著高于4o，比如編程，數據分析和數學題，但是在寫作和文本編輯方面和4o相差無幾，看起來o1確實是一個偏科的理工科選手。

六個問題帶你看懂什么是理工科學霸-OpenAI o1！-AI.x社區

OpenAI o1的安全性怎么樣？

將模型需要遵循的準則融入內在COT中，可以高效且穩健魯棒地教會模型人類偏好的價值和需要遵循的原則，不管是OpenAI內部的安全benchmark還是外部公開的benchmark，o1都能達到極高的水平。更具體的好處有兩點:

可以讓我們(不是，是OpenAI，我們看不到)更清晰地看到模型內在的思維過程；
o1關于安全規則的模型推理對于分布外場景（OOD）更加穩健.

六個問題帶你看懂什么是理工科學霸-OpenAI o1！-AI.x社區

OpenAI o1為什么要對用戶隱藏internal COT？

翻譯了一下OpenAI的原話，主要是為了用戶體驗和安全問題：

“我們認為隱藏的思維鏈為監控模型提供了獨特的機會。如果思維鏈忠實且易于理解，它允許我們“讀懂”模型的內心并理解其思維過程。例如，將來我們可能希望監控思維鏈，以識別是否存在操縱用戶的跡象。然而，為了實現這一點，模型必須能夠以未經過濾的形式表達其想法，因此我們不能將任何政策合規性或用戶偏好嵌入到思維鏈中。同時，我們也不希望讓不對齊的思維鏈直接展示給用戶。因此，在權衡用戶體驗、競爭優勢以及追求思維鏈監控的選項后，我們決定不向用戶展示原始的思維鏈。我們承認這一決定存在缺點。我們努力通過教模型在回答中重現思維鏈中的有用觀點部分來彌補這一不足。對于o1模型系列，我們展示了模型生成的思維鏈摘要。”

但是實際上，我認為主要是不想讓大家蒸餾它的內在思維過程作為訓練數據。

一些關于內在思維鏈的Cases

都太長了，展示不下，知道最重要的一點就行：內在思維鏈比思維鏈長的長的多。

編程題目

Write a bash script that takes a matrix represented as a string with format '[1,2],[3,4],[5,6]' and prints the transpose in the same format.

思維鏈

六個問題帶你看懂什么是理工科學霸-OpenAI o1！-AI.x社區

內在思維鏈

六個問題帶你看懂什么是理工科學霸-OpenAI o1！-AI.x社區

最后說一點

雖然OpenAI的o1從各方面來看很強，但對于“9.11和9.8誰大”的這個問題，依然回答存在錯誤。

六個問題帶你看懂什么是理工科學霸-OpenAI o1！-AI.x社區

可能是tokenizer的問題，不過現在還不確定，在 platform.openai.com/tokenizer 上還看不到。

六個問題帶你看懂什么是理工科學霸-OpenAI o1！-AI.x社區

讓子彈在飛一會哈。

六個問題帶你看懂什么是理工科學霸-OpenAI o1！-AI.x社區

本文轉載自?? NLP工作站??，作者：白蘇蘇

標簽

贊

收藏

回復

舉報

回復

相關推薦

剛剛，OpenAI發布史上最強模型-o1，推理能力超人類博士！

Aceryt ? 4042瀏覽 ? 0回復
OpenAI 發布新模型 o1，能夠推理復雜任務，在科學、編程和數學等領域更牛

AI洞察Insight ? 3662瀏覽 ? 0回復
OpenAI o1很強，也能被玩壞！

PaperAgent ? 3665瀏覽 ? 0回復
OpenAI發布新模型：o1系列模型，更像理科生的模型

大語言模型論文跟蹤 ? 5737瀏覽 ? 0回復
使用 OpenAI o1 的五種方法「詳細指南」

51CTO技術棧 ? 7558瀏覽 ? 0回復
國內大模型廠商是如何看待突然的OpenAI o1？跟不跟是個問題！

Syrupup ? 3433瀏覽 ? 0回復
OpenAI o1推理模型基礎入門

51CTO內容精選 ? 3589瀏覽 ? 0回復
開源社區離Openai o1越來越近~

NLP前沿1 ? 3588瀏覽 ? 0回復
OpenAI o1：用內部思維鏈進行復雜推理

shizhi02 ? 4050瀏覽 ? 0回復
327個樣本打破常規，這個"OpenAI o1復制之旅"有點燃 | RAG系統迎來重大突破！

sbf_2000 ? 3341瀏覽 ? 0回復
o1的規劃能力如何？LRM是未來嗎？

探索AGI ? 3221瀏覽 ? 0回復
OpenAI o1 模型到來后，談談提示詞工程的未來

Baihai_IDP ? 3525瀏覽 ? 0回復
Kimi深夜炸場：滿血版多模態o1級推理模型！OpenAI外全球首次！Jim Fan：同天兩款國產o1絕對不是巧合！

51CTO技術棧 ? 3891瀏覽 ? 0回復
DeepSeek R1橫空出世，超越OpenAI o1，教你用Ollama跑起來

小虎哦哦 ? 1.7w瀏覽 ? 0回復
Kimik1.5、DeepSeek-V3 大戰 OpenAI o1，誰能笑到最后？

智駐未來 ? 8072瀏覽 ? 0回復
Vision-R1：多模態領域的DeepSeek R1-Zero，7B參數比肩OpenAI O1

Syrupup ? 4079瀏覽 ? 0回復
理解什么是AI Agent，看懂這篇就夠了

AIGC新知 ? 5016瀏覽 ? 0回復
理解什么是推理模型，看懂這篇就夠了

AIGC新知 ? 4180瀏覽 ? 0回復
構建大模型 Agent 應用六個框架對比剖析

玄姐聊AGI ? 5391瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

化繁為簡！千問APP能在眾多Chat APP上殺出來嗎？ 4天前發布
3B激活參數也能做多模態Agent？小模型也有大智慧，附Skywork R1V4-Lite實測 4天前發布

熱門推薦

用 Cognee 構建端到端知識圖譜，實現當前效果最好的AI Agent記憶層 0回復

Spring AI Alibaba：Java 后端接入大模型，終于不用羨慕 Python 了！ 0回復

小模型，大能量：阿里巴巴 Qwen3-VL 4B/8B，重新定義多模態輕量化邊界 0回復

2025 年最強 OCR 大比拼：從識別文本到文檔智能，誰才是終極解法？ 0回復

8%價格，2倍速度！國產MiniMax M2暴打Claude Sonnet 4.5？我們實測后發現堪稱性價比之王！ 0回復

上一篇：如何獲取高質量數據進行代碼指令調優？

下一篇： Qwen2.5系列模型開源，你值得擁有！！！

社區精華內容

目錄

久久久久久久久久久人体| 午夜伊人狠狠久久| 亚洲free性xxxx护士hd| 久久综合亚洲色hezyo国产| 欧美在线关看| 欧美日韩亚洲不卡| 成人av在线不卡| 成年人在线视频| 国产传媒久久文化传媒| 2019亚洲男人天堂| 日本在线一级片| 国产一区二区三区探花| 日韩精品一区二区三区中文不卡| 黄色片一级视频| 粗大黑人巨茎大战欧美成人| 91女神在线视频| 亚洲一区二区久久久久久 | 亚洲成人av电影| 午夜精品一区二区在线观看的 | 精品三级在线| 欧美日韩国产丝袜美女| 强开小嫩苞一区二区三区网站| 日本精品专区| 大桥未久av一区二区三区中文| 国产精品爱啪在线线免费观看| 久久久国产精华液| 午夜av一区| 一区二区欧美久久| 一区二区视频观看| 99re8这里有精品热视频8在线| 欧洲av一区二区嗯嗯嗯啊| 九一国产精品视频| 成年人国产在线观看| 亚洲日本一区二区三区| 亚洲欧美丝袜| 成人在线观看网站| 久久精品人人做人人综合| 国产欧美在线一区二区| 亚洲精品字幕在线| 国产福利精品一区二区| 成人激情视频小说免费下载| 亚洲一区二区色| 日韩成人一级大片| 国产精品成人av性教育| 麻豆精品久久久久久久99蜜桃| 亚洲成人直播| 韩国国内大量揄拍精品视频| 免费人成在线观看| 欧美日韩亚洲国产精品| 欧美俄罗斯乱妇| 欧美成人精品激情在线视频| 欧美日韩福利| 久久久久久久久网站| 久青草视频在线观看| 国内精品久久久久久久影视蜜臀| 欧美男插女视频| 看片网站在线观看| 精品白丝av| 91精品国产91久久久久久不卡| 日本熟妇乱子伦xxxx| 亚洲三级影院| 青青a在线精品免费观看| 人妻丰满熟妇av无码区| 玖玖在线精品| 国产精品永久免费视频| 国产视频在线观看视频| 国产精品中文字幕日韩精品 | 丰满肉嫩西川结衣av| 波波电影院一区二区三区| 国偷自产av一区二区三区小尤奈| 亚州视频一区二区三区| 国产亚洲一区二区三区| 亚洲午夜久久久影院伊人| 国产原创在线观看| 亚洲国产精品尤物yw在线观看| 国产特级淫片高清视频| 成人在线视频免费| 日韩女优电影在线观看| 日本护士做爰视频| 日本一区二区三区视频| 日韩精品免费电影| 国产传媒在线看| 欧美激情五月| 国产91在线高潮白浆在线观看| 中文字幕在线播放日韩| 国产精品一区二区三区99| 精品日本一区二区| 午夜精品一区| 香港成人在线视频| 91视频这里只有精品| 国产精品1luya在线播放| 亚洲色图综合久久| 男女羞羞免费视频| 日韩综合一区二区| 97欧洲一区二区精品免费| 六十路在线观看| 一个色综合网站| 欧美一级片中文字幕| 精品欧美视频| 亚洲视频在线免费看| 久草成人在线视频| 日韩高清在线电影| 国产精品一区二区三区免费| av每日在线更新| 亚洲一区在线观看免费观看电影高清| 凹凸国产熟女精品视频| 国产一区二区三区国产精品| 亚洲精品一区二区网址| 欧美日韩在线观看成人| 日本美女视频一区二区| 久久久久无码国产精品一区| 成人直播在线| 欧美吻胸吃奶大尺度电影 | 国产精品无码专区av在线播放| 精品视频一区二区三区在线观看| 亚洲欧美在线免费| 日韩精品在线不卡| 国产成人综合在线观看| 亚洲精品国产一区| 中文在线最新版地址| 日韩精品中文字幕一区| 91麻豆精品成人一区二区| 天堂久久久久va久久久久| 国内一区二区三区在线视频| 日本伦理一区二区| 日韩欧美一区在线| 亚洲女人久久久| 六月丁香婷婷色狠狠久久| 欧洲视频一区二区三区| 欧美aa一级| 亚洲精品按摩视频| 五月天婷婷丁香| 国产成人av电影在线播放| 91免费视频黄| 精品国产三区在线| 久久精品国产96久久久香蕉| 中文字幕你懂的| 国产精品网友自拍| 天天干天天爽天天射| av影片在线一区| 国产不卡视频在线| 成人精品一区二区三区免费| 在线观看亚洲一区| 成人激情五月天| 蜜桃av一区二区在线观看| 天堂一区二区三区| 久久三级毛片| 三级精品视频久久久久| 一区不卡在线观看| 亚洲欧美日韩在线不卡| 亚洲天堂小视频| 狠狠干综合网| 国产伦精品一区二区三区免费视频 | www国产成人免费观看视频深夜成人网| 亚洲精品电影久久久| 国产成人无码一区二区在线观看| 一本综合久久| 欧美国产综合视频| 本网站久久精品| 日韩在线观看高清| www三级免费| 亚洲成av人片在线观看无码| av无码一区二区三区| 亚洲一级在线| 色女孩综合网| 91麻豆精品一二三区在线| 久久国产精品影视| 三级小视频在线观看| 欧美日韩国产综合新一区| 久久久无码人妻精品一区| 日韩**一区毛片| 无码人妻aⅴ一区二区三区日本| 视频一区日韩精品| 51精品在线观看| 电影av在线| 日韩一级精品视频在线观看| 奇米影视第四色777| 国产色一区二区| 在线观看日本www| 国产精品theporn| 欧美凹凸一区二区三区视频| 亚洲伊人精品酒店| 韩国精品美女www爽爽爽视频| 国产一二三区在线视频| 91麻豆精品国产91久久久久| 中文字幕在线观看视频网站| 国产精品国产三级国产普通话三级 | 666av成人影院在线观看| 成年无码av片在线| 欧美3p视频在线观看| 91精品国产美女浴室洗澡无遮挡| 久久精品国产亚洲av麻豆色欲| 久久久国产精华| 曰本三级日本三级日本三级| 久久在线91| 亚洲精品国产suv一区88| 国产一区99| 草莓视频一区| 久久亚洲人体| 欧洲美女7788成人免费视频| 黄色成年人视频在线观看| 亚洲男人天天操| 亚洲第一页视频| 欧美日韩aaaaaa| 久久精品无码av| 亚洲一区二区在线免费看| 免费成人深夜蜜桃视频| 91网站在线播放| 日韩大尺度视频| 免费高清在线视频一区·| a√天堂在线观看| 欧美福利专区| 亚洲精品高清视频| 亚洲区小说区| 国产精品久久久对白| 日本在线一区二区| 日韩免费av在线| 电影在线观看一区| 欧美国产精品va在线观看| 免费在线观看黄色网| 亚洲午夜国产成人av电影男同| 日本黄色免费视频| 欧美成人性战久久| 国产又粗又猛又黄| 91久久国产综合久久| 久久国产精品免费看| 亚洲国产欧美在线| 久久久久国产精品夜夜夜夜夜| 国产精品美女一区二区在线观看| 欧美熟妇一区二区| 91小视频在线免费看| 成人做爰www看视频软件| 国产精品羞羞答答xxdd| 女王人厕视频2ⅴk| 国产精品一二二区| 免费欧美一级片| 国产一区三区三区| 国产精品探花在线播放| 国产精品一区二区黑丝| 亚洲三级在线视频| 国产成人鲁色资源国产91色综| 日韩成人av免费| 国产毛片精品国产一区二区三区| 午夜剧场在线免费观看| 精彩视频一区二区| 国产成人强伦免费视频网站| 国产毛片精品视频| 影音先锋资源av| 成人h动漫精品一区二| 欧美夫妇交换xxx| 91亚洲男人天堂| 午夜精产品一区二区在线观看的| 久久久久99精品一区| 91激情视频在线观看| 亚洲国产成人自拍| a一级免费视频| 有码一区二区三区| 国产a∨精品一区二区三区仙踪林| 亚洲成人激情av| 欧美激情黑白配| 欧洲精品在线观看| 国产精品久久久久久免费播放| 日韩欧美一二三区| 日本xxxx人| 在线亚洲国产精品网| 久操视频在线免费播放| 欧美激情久久久久久| 麻豆mv在线观看| 国产精品久久不能| 91精品国产色综合久久不卡粉嫩| 99www免费人成精品| 日韩成人动漫在线观看| 神马影院一区二区| 女人色偷偷aa久久天堂| 日本中文字幕网址| 奇米影视一区二区三区小说| 手机精品视频在线| 91香蕉视频在线| 91麻豆精品久久毛片一级| 亚洲综合在线五月| 精品黑人一区二区三区| 91麻豆精品国产91久久久久久| 少妇人妻一区二区| 一级做a爰片久久毛片美女图片| 伊人电影在线观看| 欧美亚洲一级片| 麻豆国产一区二区三区四区| 精品国产乱码久久久久久丨区2区精品国产乱码久久久久久蜜柚 | 国产精品国产精品88| 欧美性猛交xxxx黑人猛交| 91亚洲国产成人精品一区| 日韩成人高清在线| 黄色成人影院| 国产精品久久久久久久久久新婚 | www.久久.com| 国产一区二区精品在线| 四虎成人av| 91好吊色国产欧美日韩在线| 美美哒免费高清在线观看视频一区二区 | 国模大尺度视频一区二区| 麻豆精品传媒视频| 欧美黄色大片网站| 欧美特级aaa| 2023国产精品视频| 久久久久香蕉视频| 欧美日韩第一区日日骚| 欧美777四色影视在线| 久久久久久久av| 亚洲综合伊人| 日韩三级在线播放| 国产精品视频| 国产情侣久久久久aⅴ免费| 日韩美女久久久| 国产成人精品一区二区色戒| 日韩精品免费电影| 超碰在线中文字幕| 粉嫩av免费一区二区三区| 亚洲国产精品日韩专区av有中文 | 婷婷视频在线播放| 日本vs亚洲vs韩国一区三区二区 | 性生交大片免费看l| 国产精品福利一区二区三区| 久久久黄色大片| 亚洲精品短视频| 国产高清自产拍av在线| 成人在线视频电影| 欧美国产另类| 国产高清av片| 亚洲色图欧洲色图| 国产又粗又猛又色又| 久久久精品国产| **国产精品| 色撸撸在线观看| 精品一区二区三区免费观看| 天海翼在线视频| 69p69国产精品| 日本蜜桃在线观看| 成人黄色短视频在线观看| 欧美黄色大片在线观看| 国产精品一区二区小说| 国产精品久久一卡二卡| 亚洲天堂avav| 久久亚洲精品视频| 成人国产精品一区二区网站| 老司机av福利| 国产精品一区二区不卡| 欧美性猛交xxxxx少妇| 欧美不卡一区二区三区| 波多野结衣久久| 久久精品日韩| 久久亚洲电影| 九九热久久免费视频| 欧美年轻男男videosbes| 高h视频在线观看| 99国精产品一二二线| 精品av久久久久电影| 中文字幕丰满乱子伦无码专区| 在线观看视频一区| 日本在线观看视频| 99热最新在线| 亚洲免费网址| 国产破处视频在线观看| 欧美一区二区三区视频在线观看 | 免费在线观看日韩av| 欧美日韩国产中字| 一广人看www在线观看免费视频| 成人h视频在线| 亚洲天堂男人| 国产jk精品白丝av在线观看| 欧美日韩综合一区| 国产探花视频在线观看| 欧美污视频久久久| 老司机精品视频一区二区三区| 91成人福利视频| 精品一区二区三区电影| 国产精品99精品一区二区三区∴| 青青草影院在线观看| 99热国产精品| 亚洲综合精品视频| 久久久久久97| 日韩电影免费网站| 永久免费未满蜜桃| 欧美日韩午夜在线| 超级碰碰不卡在线视频| 婷婷久久青草热一区二区 | 欧美日韩国产不卡| 多野结衣av一区| 正在播放一区| 91丨porny丨国产| 国产黄频在线观看| 日本一区二区在线播放| 欧美精品日本| 三年中国中文观看免费播放| 日韩美女主播在线视频一区二区三区| 日本а中文在线天堂| 樱空桃在线播放| 国产亚洲精品7777| 黄色福利在线观看| 国产欧美亚洲视频| 媚黑女一区二区|