精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

擊敗99.9%的程序員!o3來了!AGI測試實現躍升!網友:推理scaling law太炸了!一文回顧OpenAI直播帶貨12天

原創 精選
人工智能
據theinformation報道,OpenAI正在開發其下一代o1推理模型,在響應之前,這將需要更多時間來“思考”用戶查詢。然而,由于與英國電信服務提供商O2的潛在版權或商標沖突,該公司正在考慮跳過“o2”這個名字。

編輯 | 言征、伊風

網友誠不我欺,o3果真來了!

圖片圖片

就在昨天谷歌推出自己的多模態推理大模型Thingking之后,OpenAI終于坐不住了,在十二天直播的最后一天,發布了自己最先進的下一代模型o3!這里不得不感嘆一句,友商的壓力是無窮的~

不過,有朋友會好奇問,既然是下一代模型,為什么會跳過o2直接出o3呢?這可不是OpenAI今年擠牙膏式發布的風格。

原來是商標版權的問題:

據theinformation報道,OpenAI正在開發其下一代o1推理模型,在響應之前,這將需要更多時間來“思考”用戶查詢。然而,由于與英國電信服務提供商O2的潛在版權或商標沖突,該公司正在考慮跳過“o2”這個名字。

直播中,奧特曼也證明了這一說法。

圖片圖片

這次OpenAI發布了兩款型號:o3和o3 mini。前者性能最強,甚至可以在博士級科學任務上超過人類平均水平,當然也最貴;后者性價比被奧特曼稱為“已經做了最大性價比的優化”。

有這樣一句評價:o1只是用強化學習訓練了GPT,o3才是真正的展現了推理Scaling Law定律的擴展空間。

看點上,聚光燈還是給到了o3的出色編程和數學能力。相信大家對于這兩塊已經審美疲勞了,不過不要緊,這次OpenAI引進了不少的新的測試用例和基準,給了大家耳目一新的感覺,值得一探。

打敗99.9%人類程序員的超強編程能力

首先,作為被大模型率先盯上的生產力變革領域,大模型的編程能力,o3刷新了先有模型的基準。在流行的SWE基準測試上,o3達到了驚人的71.7的分數,可以理解成1000道編碼工程問題,o3可以直接為717道問題生成正確的代碼布丁并通過單元測試,而且用時還比人類少很多(分鐘級)。

圖片圖片

其次,還有一個非常新鮮的基準測試:Codeforces。這是個什么鬼?這里要首先科普下,cedeforce是一個人類編程競技平臺。這次測試就是要讓AI 在 codeforces 上面參與競賽,是跟人類選手一樣,在比賽時才會拿到賽題。

圖片圖片

如果高分參賽者輸給了低分參賽者時,那么高分參賽者的 Elo 分數會下降,而低分參賽者的 Elo 分數會上升。令人吃驚的是,目前這個競賽,有 168076 名來自全球各地的程序員參賽。

而o3竟然已經排到了175,Elo分數超過了2700分,有熱心的網友直呼:這不意味著o3已經在編程競技中擊敗了世界上 1-175/168076=99.9% 的程序員嗎?

數學:刷榜最難數學測試,吊打sota

那么,o3這次在數學方面有哪些新看點呢?

一、在美國數學奧林匹克預科考試(AIME)中,o3只打錯了一道題,在上一個版本o1最好的水平是答錯了5道題目。

圖片圖片

二、在處理博士級水平的科學任務方面,o3同樣也得到了顯著的代際提升,GPQA Diamond測試水平87.7%,已經超過了人類博士的平均水平(70%),o1的數字則是78.3%。

三、還有項測試:號稱最難數學測試的 EpochAI Frontier Math,包含最新未公開前沿題目。o3在測試中比之前SOTA從2分提升到25分。這個也是沒想到的,一下提高了12倍!

據說,這項測試難度極高,人類專業數學家解決其中一道題目也要花費數小時到數天,現在o3只需要思考幾分鐘了。

圖片圖片

AGI測試新突破,邁入新階段

Keras之父Fran?ois Chollet發起了一項面向AGI能力的測試基準ARC-AGI,典型題目為圖形邏輯推理。比如這樣式兒的——

圖片圖片

這些圖形邏輯推理題對于人類而言并不是很難,但是它能考驗模型推理的創新適應性能力,而o3在ARC-AGI上的分數從32%躍升到了75.7%、87.5%,可以說踏入了一個新階段。

圖片圖片

那為什么是兩個分數?原因當然是因為o3設置了兩個思考模式——低思考程度和高思考程度兩種設置,高思考程度花費的算力也是大的嚇人。

這里有兩個冷知識——

1.這個ARC-AGI測試中,所有任務都具有獨特性,無法提前準備;不需要特定的世界知識或語言能力;僅依賴人類普遍具備的核心認知能力。

2.AI 參與 ARC-AGI 測試的要求是:讓AI在ARC-AGI-1公共訓練集上進行訓練,訓練的預算成本要小于 1 萬美元。

但,這并不意味著o3已經是AGI了,據介紹,在該項測試中,一些非常簡單的任務,o3依舊會出錯。

有關o3 mini

OpenAI 以思考的時間和成本為基準,不僅將 o3 系列分成了 o3 和 o3 mini,甚至更進一步的將 o3 mini 分成了 low、medium、high(低中高)三個型號。

而 o1 的平均思考時間是 8.92 秒,o3 mini(high)直接翻了差不多兩倍,達到了 23.33 秒的平均思考時間。

而 o3 mini(high)在一些任務上是 o1 水平,o3 旗艦版的平均思考時間這里沒有放出來,有網友認為可能已經達到了分鐘級。

基本上就是這些了,可以看出這次o3的發布,還是給出了不少驚喜:很多都是階躍式的提升。

相信各位朋友對于能不能用上更感興趣,目前o3也只是展示階段,還沒有真正開放使用,奧特曼透露,o3 mini會在明年1月底前發布,o3也會在那之后不久開放,現在呢,如果有心急的朋友可以先去申請測試:https://openai.com/index/early-access-for-safety-testing/

最后附上以上12天的直播概覽吧,小編也在辛苦的追!

OpenAI12天發布回顧

DAY-1: o1滿血版上線

  • 滿血版o1上線多模態推理,推理速度和正確率比preview版顯著提升
  • 發布200美元/月的ChatGPT Pro 訂閱計劃,可無限制訪問 o1,還可訪問特供版o1 Pro

圖片圖片

DAY-2: 新功能強化微調推出

  • 強化微調功能上線,最低幾十個例子就可創建專家模型,使開發人員能夠創建針對各種領域復雜任務的專用AI模型

圖片圖片

DAY-3: Sora公開可用

  • Sora上線,開放給ChatGPT Plus/Pro用戶
  • Sora新增故事版(Storyboard)、Remix、Re-cut、Loop等功能

圖片圖片

DAY-4: Canvas正式上線

  • Canvas上線,提供了智能寫作、代碼協作和AI智能體為一體的工作臺

圖片圖片

上圖:Canvas界面,可以隨時與ChatGPT交互

逐漸變得濃烈的圣誕裝扮逐漸變得濃烈的圣誕裝扮

DAY-5: 官宣和蘋果的合作

  • ChatGPT宣布全面接入蘋果設備,包括iPhone、iPad和Mac,支持Apple Intelligence

DAY-6: OpenAI的Her功能上線

  • 此前的AI實時視頻對話功能推出,允許用戶通過攝像頭與ChatGPT進行互動
  • 團隊用戶、ChatGPT Plus/Pro用戶可以訪問此項功能

圖片圖片

DAY-7: Projects 功能上線

  • ChatGPT添加了“Projects”功能,相當于給ChatGPT的對話搞了個文件夾
  • “Projects”允許用戶組織聊天會話,并上傳文件、設置項目指令

圖片圖片

DAY-8: ChatGPT Search功能開放

  • ChatGPT Search功能開放給了免費用戶,并進行了大量更新,包括實時搜索、高級語音等功能

圖片圖片

DAY-9: API的重大更新

  • OpenAI將o1模型通過API全面向第三方開發者開放
  • 宣布了對Realtime API的重大更新,價格全面下調(實時API音頻token價格降了60%)
  • 推出一種全新的微調方法——偏好微調,根據開發人員的偏好更輕松地定制模型

因為與o1有關,成員很有梗的穿了草莓毛衣因為與o1有關,成員很有梗的穿了草莓毛衣

DAY-10: ChatGPT熱線電話

  • OpenAI熱線開通,美國用戶撥打1-800-ChatGPT(或 1-800-242-8478)
  • 短信服務:給上述號碼發送WhatsApp獲得ChatGPT回復

圖片圖片

DAY-11: ChatGPT與Mac應用深度集成

  • 桌面版ChatGPT打通了部分編程和寫作應用,例如Warp、XCode、Notion,能夠更加方便地執行任務

圖片圖片

DAY-12: o3/o3 mini發布

  • OpenAI最新最強模型o3,在AGI測試方面躍升

圖片圖片

完結,撒花,冬至快樂~

責任編輯:武曉燕 來源: 51CTO技術棧
相關推薦

2023-09-21 10:31:06

人工智能模型

2024-12-17 12:30:00

2025-02-14 08:30:00

模型AI訓練

2025-05-14 10:09:12

2024-12-24 16:15:04

2024-11-11 17:35:11

2025-02-07 09:05:36

2024-11-13 09:43:03

2025-04-23 08:30:05

2025-06-03 08:28:00

2025-04-07 08:42:00

2024-12-23 07:10:00

o3-miniARC-AGI人工智能

2024-12-13 13:04:13

模型Phi-4AI

2024-09-29 13:07:16

2025-02-06 09:23:07

2024-12-23 09:45:00

數據模型訓練

2024-12-24 14:30:00

模型AI訓練

2017-09-25 09:17:52

美工程序員互聯網

2025-04-23 11:19:31

2024-09-14 14:00:00

AI模型
點贊
收藏

51CTO技術棧公眾號

欧美 日韩 国产 在线观看| 久久久爽爽爽美女图片| xxx国产在线观看| 尤物视频在线免费观看| 精品一区二区国语对白| 欧美精品久久久久久久| 成人免费av片| 91麻豆精品一二三区在线| 一级女性全黄久久生活片免费| 国产在线精品一区二区三区》| 免费看毛片网站| 中文字幕日韩欧美精品高清在线 | 一本色道无码道dvd在线观看| 亚州男人的天堂| 久草热8精品视频在线观看| 欧美大片在线免费观看| 国产人妻大战黑人20p| 欧美高清hd| 欧美婷婷六月丁香综合色| 黄色三级中文字幕| 国产精品久久一区二区三区不卡| 国产乱码精品一区二区三区忘忧草| 欧美一级高清免费| 国产盗摄一区二区三区在线| 国产99久久| 欧美精品一区二区不卡| 中文字幕 欧美日韩| 国产精品粉嫩| 亚洲国产成人va在线观看天堂| 日韩电影在线播放| 黄色av免费观看| 精品无人码麻豆乱码1区2区| 奇米4444一区二区三区 | 天天爽夜夜爽夜夜爽| 开心九九激情九九欧美日韩精美视频电影| 久久久久久中文| 国产一区二区三区在线视频观看| 国内黄色精品| 精品视频中文字幕| 欧美在线一级片| 久久久久九九精品影院| 欧美日韩一区二区三区免费看 | 九色porny丨入口在线| 亚洲欧美另类图片小说| 任我爽在线视频精品一| 婷婷综合激情网| 成人激情小说乱人伦| 亚洲精品日产aⅴ| 一区二区三区免费观看视频| 久久九九免费| 国产不卡视频在线| 国产免费一级视频| 久久一区二区三区超碰国产精品| 97国产精品免费视频| 久久久久无码国产精品不卡| 综合天堂久久久久久久| 久久综合久久88| 最新一区二区三区| 亚洲影视一区二区三区| 久久天天躁狠狠躁老女人| 黄色录像免费观看| 91精品精品| 欧美理论电影在线播放| 久久久久国产精品夜夜夜夜夜| 午夜精品亚洲| 性欧美xxxx交| 中文字幕av影院| 一区二区三区成人精品| 日本一欧美一欧美一亚洲视频| 国产www在线| 日韩中文字幕91| 国产精品一区久久| 国产精品一品二区三区的使用体验| 极品少妇一区二区三区精品视频| 成人久久久久久| 精品人妻无码一区二区三区蜜桃一 | 国产又粗又猛又爽| 国产一区二区久久| 国产精品久久久久av福利动漫| 天天操天天射天天| 国产亚洲一区二区三区在线观看| 色噜噜狠狠色综合网| 日本电影全部在线观看网站视频| 亚洲欧洲制服丝袜| 青草视频在线观看视频| 午夜影院一区| 欧美中文一区二区三区| 91视频福利网| 外国成人在线视频| 亚洲社区在线观看| 日本黄色片免费观看| 亚洲国产高清一区| 国产精品成人av在线| 国产女人18毛片水18精| 99久久99久久精品国产片果冻| 欧美日韩在线精品| 黄色成人影院| 婷婷六月综合网| 亚洲综合欧美激情| 风间由美中文字幕在线看视频国产欧美| 亚洲国产成人爱av在线播放| 69视频在线观看免费| 欧美一区二区三区久久精品茉莉花| 国内精品久久影院| 一级黄色大片免费| av电影在线观看不卡| 夜夜爽www精品| av资源网在线播放| 4hu四虎永久在线影院成人| 国产精品无码一区二区三| 日韩精品久久| 51午夜精品视频| 国产视频手机在线观看| 久久日韩粉嫩一区二区三区 | 91玉足脚交白嫩脚丫| 久久综合成人| 欧美一区二区.| 精品人妻无码一区二区三区蜜桃一| 久久久亚洲精品石原莉奈| 精品人妻大屁股白浆无码| 视频精品导航| 亚洲精品中文字| 伊人365影院| 国产综合久久久久久久久久久久| 欧洲精品久久| 九色porny视频在线观看| 欧美一二三在线| 天堂av网手机版| 久久精品人人| 久久精品日产第一区二区三区精品版 | 国产露脸国语对白在线| www久久久久| 欧美一级片免费播放| 麻豆精品久久| 久久九九热免费视频| 国产精品午夜一区二区| 91网页版在线| 亚洲中文字幕无码av永久| 久久九九精品视频| 日韩视频在线免费| 一区二区日韩视频| 中文字幕精品—区二区四季| 国产精品亚洲a| 尤物tv在线精品| 欧美一区二区.| 欧美日本网站| 91成人国产精品| 微拍福利一区二区| 日本麻豆一区二区三区视频| 蜜桃传媒视频麻豆第一区免费观看 | 国产精品福利一区| 超碰超碰在线观看| 首页国产精品| 成人在线精品视频| jizz性欧美10| 日韩精品一区二区三区swag | 欧美精品aa| 91在线免费看片| 免费在线播放电影| 亚洲成av人乱码色午夜| 日韩成年人视频| av一区二区三区在线| 天堂…中文在线最新版在线| 国产毛片久久久| 青青草原一区二区| 东凛在线观看| 欧美一区二区三区在线观看| 亚洲成人生活片| 99精品偷自拍| 农村妇女精品一二区| 欧美精品一区二区久久| 国产欧美一区二区白浆黑人| 九色porny丨首页在线| 日韩欧美国产wwwww| 国产污视频在线看| 久久久精品综合| 怡红院亚洲色图| 午夜国产欧美理论在线播放 | 天天射天天色天天干| 91久久一区二区| 三级全黄做爰视频| 成人午夜精品一区二区三区| 鲁一鲁一鲁一鲁一澡| 久久在线视频| 国产精品国产三级国产专区53 | 国产女同一区二区| 羞羞污视频在线观看| 亚洲国产精品va在线看黑人| 久久久久在线视频| 亚洲日本在线视频观看| 在线观看免费视频黄| 日韩国产精品91| 国产资源第一页| 猛男gaygay欧美视频| 国产精品网站入口| missav|免费高清av在线看| 亚洲欧美福利视频| 国产黄色片网站| 色综合久久久久久久久| 欧美片一区二区| 国产欧美视频一区二区| 精品少妇人妻av一区二区三区| 丝瓜av网站精品一区二区 | 国产美女一区| 路边理发店露脸熟妇泻火| 亚洲精品推荐| 91国产在线播放| 国产综合色在线观看| 久久人人97超碰精品888 | 国产精品你懂的在线欣赏| 天堂va欧美va亚洲va老司机| 日本中文在线一区| 日韩av综合在线观看| 天天操夜夜操国产精品| 日本一区不卡| 欧美男男freegayvideosroom| 国产综合久久久久| 日韩免费小视频| 91精品国产一区| 污视频免费在线观看| 中文字幕日韩免费视频| 日漫免费在线观看网站| 欧美电影免费观看完整版| 中文字幕在线2018| 欧美视频在线观看免费| 亚洲国产综合久久| 有码一区二区三区| 一级黄色片日本| 日本一区二区视频在线| 国产交换配乱淫视频免费| 国产成人在线看| 奇米777在线视频| 久久99久国产精品黄毛片色诱| 不卡影院一区二区| 久久成人亚洲| 91国视频在线| 国产欧美在线| a√天堂在线观看| 亚洲巨乳在线| 国产精品无码人妻一区二区在线| 欧美人与禽猛交乱配视频| 中文字幕一区二区三区乱码| 日本a口亚洲| 亚洲综合网中心| 欧美好骚综合网| 伊人久久大香线蕉成人综合网| 狠狠色狠狠色综合婷婷tag| 精品国产综合久久| 欧美日韩破处| 快播亚洲色图| 国产亚洲一区| 日韩不卡av| 久久成人综合| 艳母动漫在线观看| 午夜日韩激情| 无码中文字幕色专区| 亚洲区欧美区| 国产精品亚洲αv天堂无码| 性欧美videos另类喷潮| 青青青在线播放| 蜜臀国产一区二区三区在线播放| 成人性生生活性生交12| 久久精品国产亚洲一区二区三区| 九九热精品在线播放| 国产一区在线不卡| 男人添女人荫蒂国产| av一区二区三区四区| 蜜桃精品一区二区| 国产精品女上位| 草视频在线观看| 午夜电影网一区| 69亚洲精品久久久蜜桃小说| 欧美亚洲综合在线| 国产免费视频一区二区三区| 日韩精品一区二区三区视频| 午夜激情小视频| 永久免费精品影视网站| 国产原厂视频在线观看| 国内精品伊人久久| 日韩欧美一区二区三区免费观看 | 伊人成人在线观看| 日韩一级大片在线| 亚洲三级黄色片| 中文字幕亚洲一区二区三区| 国产美女av在线| 91精品国产91| 日韩一级特黄| 精品中文字幕一区| 国产韩日影视精品| 国内精品视频一区二区三区| 日韩va亚洲va欧美va久久| 午夜诱惑痒痒网| 91美女片黄在线观看| 成人午夜免费影院| 午夜精品免费在线观看| 中文在线字幕av| 亚洲成人aaa| 美女国产在线| 欧洲一区二区视频| 一区二区三区在线免费看| 欧美一区2区三区4区公司二百| 天天影视欧美综合在线观看| 5月婷婷6月丁香| 国产一区二区在线看| 亚洲av无码一区二区二三区| 亚洲欧美激情小说另类| 手机av免费观看| 亚洲国产欧美久久| 国产一区久久精品| 国产精品极品美女在线观看免费 | 青青在线免费视频| 秋霞电影网一区二区| 成人午夜精品无码区| 国产精品国产三级国产专播品爱网| 五月天婷婷丁香| 欧美一区二区三区小说| 二区三区在线播放| 欧美在线视频观看| 成人在线视频中文字幕| 国产精品av免费| 蜜臀av性久久久久蜜臀aⅴ | www.com在线观看| 自拍偷拍亚洲一区| xx欧美xxx| 极品日韩久久| 在线成人h网| 欧美色图校园春色| 亚洲免费在线观看| 亚洲综合一区中| 正在播放欧美视频| 精品欧美一区二区三区在线观看 | 秋霞午夜鲁丝一区二区| 国产精品免费人成网站| 中文字幕在线日本| 国产婷婷色综合av蜜臀av| 91九色在线播放| 国产精品久久波多野结衣| 综合天天久久| 亚洲日本黄色片| 亚洲欧美综合另类在线卡通| 国产偷人爽久久久久久老妇app | 亚洲人成毛片在线播放女女| 国产一级二级av| 亚洲激情网站免费观看| 国产免费不卡av| 久久91精品国产91久久久| 日韩一区二区三区精品| 免费日韩在线观看| 国产91色综合久久免费分享| 久久人人爽人人爽人人| 欧美α欧美αv大片| 暖暖在线中文免费日本| av资源一区二区| 欧美日一区二区在线观看 | avtt综合网| 国产一级爱c视频| 9i在线看片成人免费| 特黄视频免费看| 亚洲午夜精品视频| 欧美国产视频| 无码人妻精品一区二区三区99v| 国产精品夜夜爽| 黄色片视频网站| 亚洲欧洲中文天堂| 黄色日韩网站| 波多野结衣 作品| www.99精品| 久久久久久久久久成人| 日韩中文字在线| 亚洲国产高清在线观看| 三上悠亚久久精品| 久久精品欧美一区二区三区不卡| 好吊色在线视频| 精品国产一区二区三区久久| 香蕉免费一区二区三区在线观看| 成年人午夜视频在线观看| 中文字幕欧美日本乱码一线二线| 国产永久免费视频| 韩国日本不卡在线| 欧美色女视频| 911亚洲精选| 欧美视频一区在线观看| av免费在线观看网站| 另类小说综合网| 极品少妇一区二区| 成人午夜视频在线播放| 久久精品视频va| 欧美91在线| 亚洲欧美日本一区二区| 午夜精品久久久久久不卡8050| 中文字幕在线观看日本| 成人av免费在线看| 日韩av一区二区在线影视| 久久精品第一页| 中文字幕久久精品| 美国一区二区| 久久久久久久久久毛片| 日韩欧美极品在线观看| 午夜伦理在线视频| 亚洲ai欧洲av|