精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

最先進推理模型! OpenAI 推出o3 和 o4-mini模型 原創

發布于 2025-4-23 08:25
瀏覽
0收藏

開篇

就在OpenAI推出 ??GPT 4.1 系列???幾天后,又發布了o3 和 o4-mini 的推理模型,這表明大模型正式邁向 AGI(?? 人工通用智能 ??)。 o3 和 o4-mini 不僅僅是 AI 模型;它們還具備智能性、自治性、可調用工具以及與真實軟件對接的技能,是一個真正意義上的AI 系統。 新模型不會被動工作;而是主動使用工具自動完成任務! 接下來,就讓我們深入了解“O 系”模型:o3 和 o4-mini 的功能、性能和應用。

o3 和 o4-mini 是什么?

o3 和 o4-mini 是 OpenAI 最新的推理模型,取代了 o 系列之前的模型,比如 o1 和 o3-mini。o 系模型不同于主要關注模式識別和文本生成的LLMs(大語言模型),o 系模型作為推理模型采用了更長的內部“思維鏈”模式。

這種方式使模型能夠分解復雜問題,評估不同步驟,并得出更準確和慎重的解決方案。因此,在諸如 STEM、編碼和邏輯推理等領域,它們尤其擅長。此外, o 系模型首創了整合工具套件的能力,能夠主動使用和組合 ChatGPT 中提供的完整工具套件。

o3 是 OpenAI 最先進的推理模型,擅長處理在各個領域需要深入分析思考的任務。該模型的計算量是 o1 的 10 倍,引入了“圖像推理”的能力。這使其能夠直接在認知過程中處理和推理關于視覺輸入的信息。

o4-mini 是 o3 模型的替代品, 相對于o3而言o4-mini更加緊湊、高效、以及成本更低。盡管o4-mini模型的參數少于o3模型,但它在數學、編碼和視覺任務等領域表現出色。通過對模型的優化設計可以確保模型具備更快的響應速度和更高的吞吐量,使其適用于高效的應用場景。

最先進推理模型! OpenAI 推出o3 和 o4-mini模型-AI.x社區

同時,OpenAI 還發布了 o4-mini-high 變體,它會花費更多時間處理用戶請求,并給出更可靠的答案。

未來,OpenAI計劃向訂閱用戶發布更強大的o3-pro版本,它將使用更多計算資源,同時也提供更好的服務。

o3 和 o4-mini 的主要功能

o3與o4-mini的強大離不開如下關鍵特性:

  • 主動行為:主動解決問題的能力,自主確定復雜任務的最佳方法,并高效地執行多步解決方案。
  • 高級工具集成:無縫地利用諸如網絡瀏覽、代碼執行和圖像生成等工具,以增強其回答并有效應對復雜查詢 。
  • 多模態推理:直接處理和整合視覺信息到他們的推理過程中,從而解釋和分析圖像與文本數據并行。
  • 高級視覺推理(“用圖像思考”):解釋復雜的視覺輸入,例如圖表、白板草圖,甚至模糊/低質量照片。它們甚至可以將這些圖像(放大、裁剪、旋轉、增強)作為推理過程的一部分,從而提取相關信息。

o3 和 o4-mini 是否反映了 AGI?

這兩個“o 系”模型會在生成響應前執行復雜的多步推理。

當用戶給出問題時, o3先會使用“蠻力”得出解決方案。接著,會嘗試找到更智能的計算方法并以更簡潔的格式呈現。然后,繼續核對答案并簡化,從而提供給用戶簡單和易于理解的回應。

最先進推理模型! OpenAI 推出o3 和 o4-mini模型-AI.x社區

盡管整個思考過程部分基于計算和訓練,但在模型的訓練過程中,并沒有被明確教導去簡化答案或重新檢查過程。不過模型的響應過程,這使之具備自我進化和自我學習的能力,從而逐漸逼近通用人工智能。

此外,o3 能夠自主決定何時以及如何使用 ChatGPT 中的各種工具(網絡搜索、Python 數據分析、DALL·E 圖像生成和視覺),以解決復雜、多方面的查詢。它可以鏈接多個工具調用,迭代搜索網絡,分析結果,并在各種模式之間綜合信息。

對 o3、o4-mini 和 o4-mini-high 進行實際測試

現在讓我們在一些實際應用中嘗試這些備受期待的新 o 系列模型。我們將測試所有三個模型在它們擅長的任務上的表現。這包括:

  • 使用 o3 進行編碼
  • 使用 o4-mini 進行數學推理
  • 使用 o4-mini-high 進行視覺推理

讓我們開始吧!

任務 1:使用 o3 進行編碼

提示詞: “創建一個 Python 模擬,其中有 2 個球 - 一個是黃色的,另一個是藍色的 - 它們在一個順時針旋轉的五邊形內的厚六邊形框架中彈跳。每次它們相撞時,球必須變成綠色,并在下一次相撞時恢復原來的顏色。它們必須以遞增的速度移動?!?/p>

最先進推理模型! OpenAI 推出o3 和 o4-mini模型-AI.x社區

o3 在不到一分鐘內生成了完全功能的、無錯的代碼,并附加了它的解釋,輸出結果非常棒!我嘗試過在其他各種模型上使用類似的提示,這絕對是第一次生成的最佳模擬之一。無論是形狀、運動方向和速度,還是顏色的變化 - 都是十分準確的!唯一出錯的是球一直在框架外移動。

任務 2:使用 o4-mini 進行數學推理的任務

提示詞: “從給定的算式中選出兩個數字,互換位置還能夠讓等式成立?”14 + 39 – (√256 ÷ 3) + (5 × 4) – 6 = 58″

最先進推理模型! OpenAI 推出o3 和 o4-mini模型-AI.x社區

o4-mini 只花了大約 10 秒鐘來回答這個問題。它展示了在生成最終答案之前的思考過程和分析,這使其更可信。結果準確無誤,速度也很快。

任務 3:使用 o4-mini-high 進行視覺推理的任務

提示詞: “軟木板上寫的點綴色是什么?”

輸入圖像:

最先進推理模型! OpenAI 推出o3 和 o4-mini模型-AI.x社區

最先進推理模型! OpenAI 推出o3 和 o4-mini模型-AI.x社區

o4-mini-high 在約一分鐘內分析了圖像并讀取了手寫文本。它首先評估了圖像的大小,放大到便利貼貼在的部分。然后裁剪圖像,將模糊部分清晰化,然后嘗試閱讀文本。這是非常出色的,目前沒有其他模型能夠做到這一點。

盡管 o4-mini-high 可以讀到便簽上寫的“ACCENT COLOURS”,但只看到了其中提到的 4 種顏色中的 3 種,甚至讀錯了。然而,有趣的是,在它的思維過程中,該模型提到無法清楚閱讀文本是因為字體太小。

出于好奇,問 o4-mini-high“顯示器和頭盔是什么品牌?”,它立刻正確識別了它們。

最先進推理模型! OpenAI 推出o3 和 o4-mini模型-AI.x社區

o3 和 o4-mini 的可用性

這兩個模型都可以通過 OpenAI 的 ChatGPT 平臺和 API 服務進行訪問:

ChatGPT 訪問 :ChatGPT Plus、Pro 和 Team 計劃的用戶可以直接在聊天界面上使用 o3、o4-mini 和 o4-mini-high 模型。

企業和教育用戶將在一周內獲得訪問權限。

免費用戶可以在提交查詢之前選擇“Think”選項來體驗 o4-mini。

API Access:開發者可以通過 OpenAI 的API將 o3 和 o4-mini 集成到其應用程序中,從而在各種平臺上實現定制 AI 解決方案。

o3 和 o4-mini:基準性能

o3 和 o4-mini 模型在一系列標準基準測試中展現出了出色的能力。

最先進推理模型! OpenAI 推出o3 和 o4-mini模型-AI.x社區

  • SWE-Lancer:這兩個模型的高變異體在這個編碼基準測試中表現出色,令它們的前輩相形見絀。
  • 經過 SWE-Bench 驗證(軟件工程):o3 取得了 69.1%的成績,而 o4-mini 緊隨其后,達到了 68.1%。這兩個模型在表現上明顯優于以往的模型,如 o3-mini(49.3%)和像 ??Claude 3.7 Sonnet????63.7%??。?
  • Aider Polyglot(代碼編輯):這兩個模型在代碼編輯基準測試中被證明是 OpenAI 中最佳的,創下了新紀錄。

最先進推理模型! OpenAI 推出o3 和 o4-mini模型-AI.x社區

  • AIME 2025 (數學):o4-mini 通過配備 Python 解釋器創下了新的基準,得分為 99.5%,而 o3 緊隨其后,得分為 98.4%。
  • Codeforces (競技編程): o4-mini 實現了 2719 的 Elo 評分,反映了其在競技編程場景中的先進問題解決能力。與此同時,o3 得分為 2706,仍遠遠優于其他模型的表現。
  • GPQA Diamond (PhD 級):o3 在不使用任何工具的情況下,通過在該基準測試上達到 87.7%的準確性,展示了先進的科學推理能力。o4-mini 緊隨其后,準確率為 81.4%。

最先進推理模型! OpenAI 推出o3 和 o4-mini模型-AI.x社區

  • MMMU(大規模多模態多任務理解):o3 在這項基準測試中表現出色,展示出其處理涉及文本和視覺數據的多樣且復雜任務的能力。

最先進推理模型! OpenAI 推出o3 和 o4-mini模型-AI.x社區

  • Humanity’s Last Exam :在跨領域專家級推理能力的基準測試中,o3 的準確度達到了 26.6%,勝過所有其他 OpenAI 模型。與此同時,o4-mini 明顯優于其前身 o3-mini。

o3 和 o4-mini 的應用

o3 和 o4-mini 的增強推理、工具使用和視覺能力解鎖了各種潛在應用,包括:

  • 復雜數據分析和報告: 通過編寫和執行 Python 代碼分析數據集,從網絡獲取補充信息,并生成摘要或可視化。
  • 高級科學研究:通過解釋復雜圖表、分析實驗數據、搜索文獻,并可能提出新的研究方向,來協助研究人員。
  • 高級編碼和軟件工程:調試復雜的代碼,基于視覺模擬或圖表生成代碼,理解存儲庫結構,并執行多步驟的軟件開發任務。
  • 教育和輔導:使用逐步推理解釋復雜的 STEM 概念,解釋教科書圖表或手寫筆記,并提供互動問題解決協助。
  • 多模態內容創作與理解:生成圖像的詳細描述或分析,創建需要整合文本和視覺元素的內容,并根據視覺證據回答問題。
  • 商業智能與策略:使用實時網絡數據分析市場趨勢,制定預測,并基于綜合信息來源創建戰略計劃。
  • 創新問題解決:解決需要結合不同類型信息和推理步驟的開放性挑戰。

結論

OpenAI 的 o3 和 o4-mini 模型代表了人工智能能力的重大進步,特別是在推理和多模態理解方面。通過將深層推理與多才多藝的工具使用以及“以圖像思考”的新能力相結合,為人工智能的智能和效用設定了新標準。在各種基準測試中的出色表現,凸顯了在處理軟件工程以及科學研究等領域的復雜任務的潛力。

o3 即使面對最苛刻任務也展現出高性能的一面,而o4-mini 則展現了能力、速度和成本的一種平衡。無論如何,兩個模型都擁有自主能力,體現了人工智能的先進程度。隨著人工智能的不斷發展,這種創新模型將為更復雜和多樣化的應用鋪平道路,使我們更接近實現 AGI(通用人工智能)。

譯者介紹

崔皓,51CTO社區編輯,資深架構師,擁有18年的軟件開發和架構經驗,10年分布式架構經驗。

原文標題:??o3 and o4-mini: OpenAI’s Most Advanced Reasoning Models??,作者:K.C. Sabreena Basheer

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2025-4-23 08:30:26修改
收藏
回復
舉報
回復
相關推薦
国产免费成人在线视频| 老司机午夜精品视频| 欧美成人伊人久久综合网| 男女猛烈激情xx00免费视频| 韩日在线视频| 国产一区二区三区精品欧美日韩一区二区三区| 欧美裸体xxxx极品少妇| 老鸭窝一区二区| 亚洲伦理久久| 欧美性猛交xxxx黑人猛交| 亚洲精品欧洲精品| 男人的天堂a在线| 日本中文字幕一区| 久久久久久亚洲精品| 欧美老女人性生活视频| 久久久免费毛片| 欧美一区二区女人| 男女啪啪网站视频| 天堂av在线网| 亚洲一区二区不卡免费| 亚洲午夜高清视频| 欧美捆绑视频| 成人免费看黄yyy456| 成人精品在线视频| 久久久蜜桃一区二区| 影音先锋久久| 久久电影一区二区| 亚洲图片第一页| 全球av集中精品导航福利| 欧美一区二区在线免费观看| 日本va中文字幕| 不卡av免费观看| 亚洲欧美区自拍先锋| 日韩视频在线观看国产| 秋霞视频一区二区| 国产激情一区二区三区| 国产欧美一区二区三区在线看| 午夜婷婷在线观看| 一本色道88久久加勒比精品| 欧美激情精品久久久久久久变态| 国产精品suv一区二区88| 国内精品视频在线观看| 国产丝袜高跟一区| 538国产视频| 欧美精品中文| 亚洲精品国产欧美| 欧美在线一级片| 久久精品国产亚洲5555| 亚洲第一中文字幕在线观看| 四虎成人免费视频| xvideos.蜜桃一区二区| 精品欧美乱码久久久久久1区2区 | 影音先锋中文在线视频| 国产精品福利一区二区三区| 亚洲精品在线观看免费| av在线电影网| 中文字幕一区二区三区乱码在线| 亚洲欧美日韩另类精品一区二区三区 | 毛片大全在线观看| 亚洲影院免费观看| 国产96在线 | 亚洲| 国产高清中文字幕在线| 日韩欧美国产一区二区| 日韩欧美xxxx| 欧美性www| 欧美一区二区三区视频在线观看| 国模大尺度视频| 极品国产人妖chinesets亚洲人妖| 亚洲成人免费网站| 国产激情在线免费观看| 欧美精品羞羞答答| 免费av一区二区| 国产精品第二十页| 男女精品视频| 国产精品一区二区3区| 99久久精品国产一区色 | 亚洲专区区免费| 国产在视频线精品视频www666| 尤物yw午夜国产精品视频明星 | 免费黄色片在线观看| 国产精品久久久久久久第一福利 | 操她视频在线观看| 欧美日韩亚洲一区在线观看| 97视频国产在线| 自拍偷拍第八页| 国产麻豆精品theporn| 国产精品国模大尺度私拍| 欧美日韩国产综合视频| 国产精品毛片大码女人| 黄色网在线视频| 欧美成人ⅴideosxxxxx| 5566中文字幕一区二区电影| 免费成人深夜夜行p站| 久久亚洲国产| 97在线精品视频| 欧美成人一区二区视频| 大桥未久av一区二区三区中文| 欧美在线一二三区| 色在线视频网| 欧美三区在线观看| 国产+高潮+白浆+无码| 日韩午夜电影网| 69av在线视频| www.成人免费视频| 中文字幕av一区二区三区高| 日韩精品一区在线视频| 日韩成人在线一区| 亚洲久久久久久久久久久| 欧美成人免费观看视频| 日韩精品一二三| 狠狠色综合色区| a篇片在线观看网站| 欧美综合一区二区| 午夜一区二区三区免费| 国产精品99一区二区| 国产美女精品视频| 欧洲成人av| 激情成人在线视频| 国产吃瓜黑料一区二区| 色综合天天爱| 国产极品jizzhd欧美| 天堂网2014av| 亚洲一区日韩精品中文字幕| 亚洲网中文字幕| 色综合久久网| 国产精品一区二区电影| 国产日韩精品在线看| 疯狂做受xxxx高潮欧美日本| 久久久男人的天堂| 午夜国产欧美理论在线播放| 国产综合香蕉五月婷在线| 电影av在线| 色av成人天堂桃色av| 黄色免费视频网站| 欧美体内she精视频在线观看| 成人黄色免费在线观看| 色开心亚洲综合| 欧美人与性动xxxx| 手机看片国产日韩| 日本不卡的三区四区五区| 欧美亚洲一级二级| 国产亚洲一区二区手机在线观看| 日韩精品视频在线观看免费| 国产微拍精品一区| 91麻豆精品秘密| 人妻精品无码一区二区三区 | 国产视频精品xxxx| 久久国产黄色片| 91首页免费视频| 1024av视频| 精品一区三区| 国产精品99久久久久久人| 国产午夜在线视频| 欧美系列亚洲系列| 免费观看特级毛片| 国内精品第一页| 91视频 - 88av| 精品女人视频| 欧美在线视频免费| 国产大片在线免费观看| 欧美日韩一区二区在线观看视频| 丁香激情五月少妇| 精品一区二区三区久久| 丁香色欲久久久久久综合网| 久久a爱视频| 日产精品久久久一区二区福利| 国产在线三区| 5566中文字幕一区二区电影| 国产精品二区一区二区aⅴ| 97成人超碰视| 麻豆一区二区三区视频| 亚洲综合激情在线| 精品久久久久久中文字幕动漫| 玛雅亚洲电影| 俺也去精品视频在线观看| 精品国产免费无码久久久| 同产精品九九九| 中文字幕第24页| 国产乱一区二区| 能在线观看的av| 四虎国产精品免费观看| 国产乱码精品一区二区三区卡 | 成人羞羞视频免费| 综合另类专区| 久久激情五月丁香伊人| 日韩在线观看视频一区二区三区 | 少妇性l交大片| 天天综合一区| 久久国产日韩欧美| 4438五月综合| 欧美中文字幕在线观看| 欧美激情午夜| 日韩精品有码在线观看| 国产精品无码在线播放| 欧美午夜宅男影院在线观看| 亚洲怡红院在线观看| 99re在线视频这里只有精品| 爱爱爱爱免费视频| 久久不射网站| 国产91在线亚洲| 日韩精品久久久久久久电影99爱| 国产成人精品一区二区三区福利| 亚洲不卡系列| 97视频在线观看免费高清完整版在线观看 | 五月天激情图片| 国产成人短视频在线观看| 国产91社区| 四虎影视成人精品国库在线观看| 91超碰中文字幕久久精品| 国产日产一区二区| 国产一区二区三区四区福利| 欧美一区二不卡视频| 欧美精品xxxxbbbb| 欧美一区二区三区不卡视频| 亚洲综合激情另类小说区| 欧美a在线播放| 久久综合狠狠综合久久激情 | 亚洲国产精品国自产拍av| 粉嫩av懂色av蜜臀av分享| 国模少妇一区二区三区| 久久久久久久片| 午夜在线精品偷拍| 欧美午夜性视频| 欧美久久久久| 大桥未久一区二区三区| 99久久久久国产精品| 日韩一区免费观看| 国产99久久精品一区二区300| 精品1区2区| 美国一区二区| 91免费看网站| 视频欧美一区| 91精品中文在线| 91麻豆精品一二三区在线| 国产精品久久一| 主播大秀视频在线观看一区二区| 欧美在线视频免费| av电影一区| 日本高清久久天堂| 中文字幕一区久| 国产91色在线播放| 欧美特黄aaaaaaaa大片| 国产成人+综合亚洲+天堂| 超级碰碰久久| 国产成人亚洲综合91精品| 亚洲精品在线影院| 国产精品久久久久91| 一呦二呦三呦精品国产| 国产精品免费看久久久香蕉| 久久不卡日韩美女| 国产狼人综合免费视频| 9999精品免费视频| 亚洲影院在线看| 哺乳一区二区三区中文视频| 国产精品日韩高清| 亚洲黄页网站| 日韩精品欧美在线| 欧美激情成人| 免费看日b视频| 亚洲每日更新| 日韩一级在线免费观看| 热久久久久久久| 五月婷婷之婷婷| 国产河南妇女毛片精品久久久| 日本泡妞xxxx免费视频软件| 99久久伊人网影院| 亚洲精品午夜视频| 国产精品久久久久毛片软件| 欧美黑人猛猛猛| 精品二区三区线观看| 免费黄色片视频| 7777精品伊人久久久大香线蕉经典版下载 | 精品成人影院| 视频一区二区视频| 99在线精品免费视频九九视| 青青在线免费观看视频| 久久精品国产99久久6| 亚洲免费观看在线| 久久久99精品免费观看| 午夜精品一区二区三级视频| 亚洲一区电影777| 免费黄色一级大片| 日韩一区二区三区在线观看| 四虎影视在线播放| 久久国产一区二区三区| 国产理论在线| 91精品在线观看视频| 欧美a大片欧美片| 亚洲午夜精品一区二区| 亚洲精华国产欧美| 欧美成人乱码一二三四区免费| 国产成人aaaa| 美女100%露胸无遮挡| 亚洲午夜av在线| 伊人22222| 亚洲精品国产精品国产自| 在线看av的网址| 91国内免费在线视频| 日韩电影精品| 免费观看国产成人| 欧美高清日韩| 一区二区三区免费播放| 99精品一区二区三区| 欧洲第一无人区观看| 色偷偷成人一区二区三区91| 丰满人妻熟女aⅴ一区| 中文字幕亚洲无线码a| 老牛影视精品| 成人午夜电影在线播放| 久久久国产精品| 男女啪啪网站视频| 久久先锋资源网| 国产无遮挡免费视频| 91精品国产手机| 91精品专区| 浅井舞香一区二区| 免费日韩一区二区三区| 久久久久久久久久伊人| 精品综合久久久久久8888| 波多野吉衣中文字幕| 香港成人在线视频| 亚洲精品久久久久久无码色欲四季| 色小说视频一区| 欧美大片1688网站| 欧美日本韩国国产| 中文精品视频| 日本三级日本三级日本三级极| 亚洲精选在线视频| 国产精品久久久久久在线| 自拍偷拍免费精品| 91另类视频| 亚洲 日韩 国产第一区| 乱人伦精品视频在线观看| 人妻少妇精品视频一区二区三区| 亚洲国产另类av| 高h放荡受浪受bl| 欧美激情在线狂野欧美精品| 久久精品一级| 一本大道东京热无码aⅴ| 国产一区二区精品久久91| 日本少妇aaa| 91麻豆精品91久久久久同性| 欧美激情黑人| 亚洲free嫩bbb| 欧美激情日韩| 极品白嫩的小少妇| 精品成人国产在线观看男人呻吟| 蜜桃视频久久一区免费观看入口| 国内免费精品永久在线视频| 美国十次av导航亚洲入口| 欧美视频在线播放一区| 91欧美一区二区| 成人免费一级片| 日韩中文字在线| 国产精品一区免费在线| 粉嫩av一区二区三区天美传媒| 国产成人精品三级麻豆| 免费毛片一区二区三区| 精品视频在线播放色网色视频| a欧美人片人妖| 亚洲v国产v| 国产伦精品一区二区三区免费 | 国产乱国产乱老熟300| 欧美不卡激情三级在线观看| 精品丝袜在线| 日韩欧美视频一区二区| 久久av资源站| 久久亚洲国产成人精品性色| 亚洲缚视频在线观看| 香蕉成人av| 国产高清免费在线| 成人黄色a**站在线观看| 超碰在线观看91| 按摩亚洲人久久| 欧美理论电影在线精品| 欧美亚洲日本在线观看| 亚洲精品水蜜桃| 邻居大乳一区二区三区| 91精品国产综合久久久久久久久| 欧美日本一区二区视频在线观看| 中文字幕免费在线播放| 欧美综合天天夜夜久久| 制服丝袜在线播放| 欧美久久在线| 国产乱妇无码大片在线观看| 国产精品黄色大片| 久久久精品一区二区| 欧美一级三级| 久久精品国产99久久99久久久| 五月婷婷综合在线| 免费黄色网页在线观看| 精品日本一区二区| 精品一区二区三区蜜桃| 狠狠人妻久久久久久综合| 久久久www成人免费精品张筱雨| 精品女人视频| 天天爽夜夜爽视频| 在线观看欧美精品| 大香伊人中文字幕精品| 亚洲在线色站|