精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

GPT-4.5發(fā)布了,參數(shù)規(guī)模可能在3-5萬億之間,宣稱是最好的聊天模型,但有“強弩之末”的感覺

發(fā)布于 2025-3-13 06:57
瀏覽
0收藏

2月28日OpenAI發(fā)布了GPT-4.5,OpenAI稱這是其迄今為止最大的預訓練模型。我有點期待GPT-4.5會帶來令人振奮的突破。然而,從官方披露的信息以及實際表現(xiàn)來看,GPT-4.5沒有展現(xiàn)出超越前代模型的顯著優(yōu)勢。有點“強弩之末”的感覺。可能再次驗證了業(yè)界比較廣泛的認知:“單純擴大模型參數(shù)規(guī)模,對性能提升的邊際效應正在遞減” 。接下來分幾個章節(jié),談談我的感受。

期待與現(xiàn)實的落差

GPT-4.5 被 OpenAI 定位為“our largest and best model for chat yet”,暗示其在規(guī)模和技術能力上的重要進展。然而,與兩年前 GPT-4發(fā)布時的轟動效應相比,GPT-4.5 的亮相顯得低調(奧特曼沒有參加)。官方文章提到,其核心進步在于通過擴展無監(jiān)督學習(unsupervised learning,可以理解為“預訓練”)提升了知識廣度和可靠性,但并未強調推理能力的顯著增強。我認為,盡管 GPT-4.5 在某些領域(如減少幻覺)有所改進,但整體表現(xiàn)并未帶來顛覆性的驚喜。

GPT-4.5 的技術細節(jié)與參數(shù)規(guī)模估測

OpenAI 未公開 GPT-4.5 的具體參數(shù)數(shù)量,但從其描述和行業(yè)趨勢來看,我們推測一下。

  1. 基準參考GPT-4的參數(shù)規(guī)模據(jù)推測約為1.76萬億(https://en.wikipedia.org/wiki/GPT-4)。
  2. 計算資源官方文件提到GPT-4.5在Microsoft Azure AI超級計算機上訓練,這表明其計算需求可能遠超GPT-4。
  3. 模型架構假設GPT-4.5可能延續(xù)了Mixture of Experts(MoE)架構(https://the-decoder.com/gpt-4-architecture-datasets-costs-and-more-leaked/ ),MoE架構能在參數(shù)規(guī)模增加的同時優(yōu)化計算效率。結合MoE模型的參數(shù)分布特點,我推測 GPT-4.5 的參數(shù)規(guī)模在3萬億至5萬億之間。
  4. 性能反饋驗證官方數(shù)據(jù)表明,GPT-4.5在SimpleQA準確率上為62.5%,相較GPT-4o略有提升。暗示參數(shù)規(guī)模的增長未帶來比例相當?shù)男阅茉鲆妫С制湟?guī)模可能在3萬億至5萬億的假設——足夠大,但未達天文數(shù)字。

GPT-4.5發(fā)布了,參數(shù)規(guī)模可能在3-5萬億之間,宣稱是最好的聊天模型,但有“強弩之末”的感覺-AI.x社區(qū)

更大規(guī)模為何未帶來耀眼表現(xiàn)?

GPT-4.5 的訓練聚焦于擴展無監(jiān)督學習,通過增加計算資源和數(shù)據(jù)量提升模型的“世界知識深度”(deeper world knowledge)。官方稱其在知識問答中的幻覺率降低,且在日常查詢(63.2% 勝率)和專業(yè)查詢(56.8% 勝率)中優(yōu)于 GPT-4o。此外,GPT-4.5 未引入顯著的推理增強機制,而是強化了與人類的協(xié)作能力(如更高的“EQ”和 steerability)。這些特點表明,OpenAI 在GPT-4.5中選擇了“廣度優(yōu)先”的發(fā)展路徑,而非“深度突破”。

盡管 GPT-4.5 的參數(shù)規(guī)模可能達到 3 萬億,其性能提升卻遠不如預期。例如,在學術基準測試中,GPT-4.5 的 AIME 2024(數(shù)學競賽)得分僅為 36.7%,雖高于 GPT-4o 的 9.3%,但遠不及推理模型 OpenAI o1 的 87.3%。同樣,在 SWE-Bench Verified(編碼任務)中,GPT-4.5 的 38.0% 表現(xiàn)雖優(yōu)于 GPT-4o(30.7%),但并未展現(xiàn)出壓倒性優(yōu)勢。這種“規(guī)模大、增益小”的現(xiàn)象可能源于以下原因:

  1. 數(shù)據(jù)質量瓶頸訓練數(shù)據(jù)的總量雖增加,但其中人類有效知識的比例可能不足。GPT-4.5 在SimpleQA上幻覺率降低,表明其知識記憶更準確,但推理能力未見顯著增強。這可能因為數(shù)據(jù)中缺乏足夠的高質量邏輯推理樣本,導致模型在“記憶”上進步,卻在“思考”上停滯。
  2. 架構效率限制我們可以用圖書館來類比Transformer架構的大模型。參數(shù)規(guī)模可以視為圖書館的書架數(shù)量。通常來說,書架越多,能容納的書籍(知識)就越多。但當參數(shù)規(guī)模擴大到一定程度時,可能會出現(xiàn)效率遞減的情況。這就好比,一味地擴建圖書館、增加書架,但如果新增加的書籍大多是內容重復的,或者是質量低劣、雜亂無章的,那么讀者并不會因為圖書館變大了就變得更聰明——模型的輸出質量也不會因此顯著提升。

    反過來,如果模型參數(shù)規(guī)模過小,則其知識記憶能力會相對較差。 仍然以圖書館為例:如果一個圖書館很小,書架數(shù)量有限,卻要容納海量的書籍,那么很可能只能將每本書的內容進行大幅精簡,甚至只保留核心概要。這樣一來,很多知識的細節(jié)就會丟失,讀者也就無法獲取全面、深入的信息。但是有必要說明的是,很多小模型的推理能力不差,原因是“推理”與概念體系更相關,概念體系更容易通過知識點的壓縮來達到,這也是之前Ilya為什么說:Compression is Intelligence!

轉向Testing Time Computing Scaling Law

面對預訓練的局限,業(yè)界已經將目光轉向Testing Time Computing Scaling Law,即通過推理時增加計算量提升性能。這種趨勢在DeepSeekmR1, OpenAI的o1/o3,Qwen QwQ等模型中已有體現(xiàn),它們通過更長的思維鏈推理(chain-of-thought)顯著提高了復雜任務的解決能力。

本文轉載自??后向傳播??,作者: 張發(fā)恩 ????


收藏
回復
舉報
回復
相關推薦
狠狠色狠狠色综合| 成人av动漫| 中文字幕一区二区三区乱码在线| 国产成人一区二区三区电影| 欧美成人国产精品一区二区| 欧美亚洲福利| 亚洲国产美国国产综合一区二区| 精品国产乱码久久久久| 亚洲日本视频在线观看| 精品免费在线| 91精品福利在线一区二区三区| 强伦女教师2:伦理在线观看| 国内爆初菊对白视频| 久久成人免费| 操日韩av在线电影| aaaaa一级片| 精品国产亚洲一区二区在线观看 | 国产高清精品一区二区| 91av在线免费视频| 999久久久91| 亚洲精品美女久久久久| 中日韩av在线播放| 在线观看涩涩| 一区二区三区国产| 天堂精品视频| 婷婷久久久久久| 精品无人码麻豆乱码1区2区| 97久久精品国产| 中文字幕第69页| 盗摄牛牛av影视一区二区| 欧美中文字幕一区二区三区亚洲| 国产乱人伦精品一区二区三区| 免费黄网站在线观看| 国产乱码精品1区2区3区| 日本精品免费观看| 毛片a片免费观看| 欧美gvvideo网站| 亚洲美女精品久久| 激情综合激情五月| 国产亚洲精aa在线看| 色诱亚洲精品久久久久久| 无码日本精品xxxxxxxxx| 无遮挡的视频在线观看| 国产色产综合产在线视频| 国产一区二区中文字幕免费看| 97在线视频人妻无码| 日韩精品免费专区| 欧美亚洲视频一区二区| 国产真人真事毛片| 欧美久久一区| 九九久久综合网站| 色婷婷在线视频观看| 婷婷综合伊人| 久久激情视频久久| 丁香六月激情综合| 日本激情一区| 最近免费中文字幕视频2019| 国产人妻大战黑人20p| 任你躁在线精品免费| 亚洲成av人片在线观看香蕉| 国产51自产区| 精品国产午夜肉伦伦影院| 日韩欧美黄色影院| 四川一级毛毛片| 日本久久伊人| 欧美成人乱码一区二区三区| 亚洲欧洲日韩综合| 北条麻妃在线一区二区免费播放 | 欧洲成人午夜精品无码区久久| 亚洲美女色播| 欧美一二三四在线| 国产老头和老头xxxx×| 中文字幕区一区二区三| 精品毛片乱码1区2区3区| 老熟女高潮一区二区三区| 99a精品视频在线观看| 精品国产露脸精彩对白| 中文成人无字幕乱码精品区| 国产精品xxxav免费视频| 亚洲国产欧美一区二区三区久久| 捆绑凌虐一区二区三区| 免费电影一区二区三区| 中文字幕国产精品久久| 无码黑人精品一区二区| 亚洲性色视频| 欧美一区二区三区四区在线| 91丨九色丨海角社区| 久久aⅴ国产欧美74aaa| 国产福利久久| 搞黄视频免费在线观看| 亚洲欧美另类综合偷拍| 男人插女人视频在线观看| 大胆人体一区| 欧美老女人在线| 美女久久久久久久久| 伊人久久大香线蕉| 久久精品国产亚洲| 国产午夜福利片| 老**午夜毛片一区二区三区| 国产欧美日韩高清| 亚洲精品一区二区三区四区 | 久久99久久99精品免费看小说| 影音先锋日韩在线| 91国产美女视频| 一级成人免费视频| 不卡电影一区二区三区| 天天人人精品| 福利影院在线看| 欧美男人的天堂一二区| 五十路六十路七十路熟婆| 日韩欧美伦理| 69av在线视频| av中文字幕免费| 久久综合九色综合97婷婷女人 | 人人人妻人人澡人人爽欧美一区| 亚洲综合中文| 国产97在线播放| 国产超碰人人模人人爽人人添| 26uuu精品一区二区三区四区在线| 亚洲最新在线| 香蕉视频亚洲一级| 亚洲国产精品人久久电影| 四虎884aa成人精品| 国产一区二区你懂的| 1区1区3区4区产品乱码芒果精品| 国产在线一二| 精品久久久久久久久国产字幕| 日韩av片免费观看| 欧洲三级视频| 日本高清视频精品| 亚州av在线播放| 伊人性伊人情综合网| 一道本视频在线观看| 日韩高清成人在线| 久久久亚洲福利精品午夜| 91尤物国产福利在线观看| 久久久午夜电影| 成人中文字幕在线播放| 9l视频自拍九色9l视频成人| 日韩在线精品视频| 中文字幕在线播放av| 国产无遮挡一区二区三区毛片日本| 久久国产精品网| 视频一区国产| 久久99亚洲精品| 国产熟女一区二区丰满| 国产精品久久久久久久久久免费看 | 欧美日韩综合视频| 女同性恋一区二区三区| 精品999日本| 国产女主播一区二区| 污视频在线免费观看网站| 制服丝袜亚洲网站| 夫妻性生活毛片| 极品少妇xxxx精品少妇| 亚洲精品在线免费看| 99久久婷婷国产综合精品首页| 亚洲日本aⅴ片在线观看香蕉| 69国产精品视频免费观看| 99久久婷婷国产综合精品电影| 久操网在线观看| 欧美久久精品| 日本精品在线视频| h网站在线免费观看| 欧美偷拍一区二区| 任你操精品视频| 国产一区二区三区综合| 欧美 国产 精品| 亚洲精品一区二区三区在线| 久久99视频精品| 午夜视频免费在线| 色婷婷综合久久久| 91麻豆制片厂| 狠狠色丁香久久婷婷综合_中 | 欧美挠脚心视频网站| 91麻豆精品成人一区二区| 精品午夜久久福利影院| 国产高清不卡无码视频| 久久动漫网址| 国产成人精品在线视频| 日本三级在线播放完整版| 欧美一区二区免费观在线| 国产亚洲精品久久久久久无几年桃| 岛国av在线一区| 欧美激情成人网| 四虎成人av| 国产一区二区高清视频| 不卡av播放| 久久久久北条麻妃免费看| 亚洲成熟女性毛茸茸| 欧美日韩在线免费| 永久免费毛片在线观看| 国产福利91精品| 美女av免费在线观看| 999精品一区| 久久综合色一本| crdy在线观看欧美| 亲爱的老师9免费观看全集电视剧| 日本美女高清在线观看免费| 精品国产一区二区亚洲人成毛片| 欧美一区二区三区不卡视频| 亚洲欧美国产毛片在线| 国产高潮呻吟久久| 成人免费视频一区| jizz欧美性11| 欧美专区一区二区三区| 国产精品8888| 日韩精品一区二区三区免费观影| 国产精品免费一区二区三区| 国产福利亚洲| 日韩av第一页| 182在线播放| 欧美成人网在线| 亚洲图片88| 日韩电影免费观看在线观看| 精品久久久久久亚洲综合网站| 在线观看免费视频综合| 日韩三级小视频| 一级特黄大欧美久久久| 国产一二三av| 国产欧美一区二区精品久导航| 国产人妻黑人一区二区三区| 国产乱码精品一区二区三区五月婷 | 欧美精品一区二区三区久久| 日韩免费一级| 国产精品入口免费视频一| www.久久ai| 中文字幕在线亚洲| 俄罗斯嫩小性bbwbbw| 91.麻豆视频| 国产性生活视频| 亚洲一区二区欧美日韩| 欧美黄色aaa| 国产亲近乱来精品视频 | 中文字幕 国产精品| 亚洲福利一二三区| 欧美精品一级片| 国产精品久久久久一区二区三区 | 草草草视频在线观看| 色狮一区二区三区四区视频| 久久久99爱| www.亚洲一二| 国产美女精品在线观看| 国产精品亚洲一区二区在线观看 | 精品无码免费视频| 亚洲欧美激情插| 国产精品1区2区3区4区| 国产亚洲综合性久久久影院| 中文乱码人妻一区二区三区视频| 国产成人精品影院| 无码人妻一区二区三区在线视频| 美女视频一区二区| 成年人三级黄色片| 日本最新不卡在线| 超碰网在线观看| 日韩avvvv在线播放| 久久精品视频91| 免费视频一区| bt天堂新版中文在线地址| 亚洲国产免费看| 日日摸日日碰夜夜爽无码| 国产精品黄色| 91国视频在线| 亚洲一区二区三区免费在线观看| 久久久久免费看黄a片app| 99亚洲一区二区| 黄色一级视频片| 亚洲一级在线| 国产97色在线 | 日韩| 99热精品在线观看| 熟女人妇 成熟妇女系列视频| 日韩经典中文字幕一区| 久久久精品麻豆| 国产九色精品成人porny | 国产麻豆精品在线| 日本少妇xxxx软件| 成人av在线网| 一级片手机在线观看| **欧美大码日韩| 久久精品国产av一区二区三区| 亚洲成人av在线电影| 无码人妻丰满熟妇奶水区码| 在线观看日韩电影| 国产影视一区二区| 欧美成人午夜电影| 手机看片福利永久| 国产亚洲精品久久久久久| 经典三级在线| 久久久精品免费视频| 日本中文字幕中出在线| 性色av一区二区三区红粉影视| 成人看片在线观看| 成人黄色免费片| 999精品视频在这里| 亚洲精品高清视频| 欧美人成在线| 无码aⅴ精品一区二区三区浪潮| 麻豆视频观看网址久久| 人妻体体内射精一区二区| av资源站一区| 国产在线免费看| 午夜成人在线视频| 欧美日韩 一区二区三区| 欧美美女喷水视频| 色呦呦视频在线| 亚洲图中文字幕| caoprom在线| 国产精品嫩草视频| 精品亚洲二区| 日本在线观看一区二区| 中文乱码免费一区二区三区下载| 奇米影视亚洲色图| 日本中文字幕不卡| 精品人妻一区二区三区香蕉| 亚洲欧洲精品一区二区精品久久久| 久久久久成人片免费观看蜜芽| 欧美午夜一区二区三区 | 欧美不卡高清一区二区三区| 91久久国产精品91久久性色| 久久夜色精品国产噜噜av小说| 最新视频 - x88av| 国产亚洲高清视频| 一级淫片在线观看| 国产精品久久毛片| 国产精品一区二区6| 911精品产国品一二三产区| yourporn在线观看中文站| 久久久久久久久久久久久久久久久久av| 亚洲承认视频| 精品国产乱码久久久久久108| 欧美国产一级| 国产精品免费成人| 久久众筹精品私拍模特| 欧美黑人猛猛猛| 欧美色图片你懂的| 中文字幕日本在线| 国产成人精品日本亚洲| 国产精品超碰| 大荫蒂性生交片| 国模大尺度一区二区三区| 一级黄色片大全| 日本韩国精品一区二区在线观看| 蜜臀av中文字幕| 欧美精品在线视频观看| 欧美h版在线观看| 一区二区三区我不卡| 翔田千里一区二区| 亚洲最大成人网站| 精品日韩美女的视频高清| 亚洲欧美激情国产综合久久久| 久久久av一区| 91丨精品丨国产| 麻豆一区二区三区在线观看| 美腿丝袜一区二区三区| 伊人影院综合网| 欧美视频在线一区| 国产福利片在线| 国产成人精品av在线| 精品欧美激情在线观看| 人人爽人人av| www欧美成人18+| 这里只有久久精品视频| 亚洲色图25p| 国产精品诱惑| 亚洲欧洲日韩精品| 久久福利视频一区二区| 破处女黄色一级片| 日韩欧美国产一区在线观看| 国产视频一区二区| 国产亚洲精品久久飘花| 夜久久久久久| 成人性生活免费看| 在线一区二区视频| 在线看免费av| 99国产超薄肉色丝袜交足的后果 | 久久夜色精品国产欧美乱| av国产精品| 91精品91久久久中77777老牛| 久久久久久久久蜜桃| 五月天中文字幕| 欧美国产日韩精品| 国产精品网站在线看| 青青草av网站| 亚洲欧洲三级电影| 精品人妻一区二区三区日产乱码 | 秋霞在线观看一区二区三区| 日韩一区欧美二区| 99成人在线观看| 精品国产成人系列| 国产精品.xx视频.xxtv| 中文字幕第50页| 粉嫩aⅴ一区二区三区四区| 日韩精品视频播放| 尤物九九久久国产精品的分类| 亚洲日本视频在线| 国产精品沙发午睡系列| 91在线观看污| av网站在线免费看| 国产91精品网站| 精品91视频|