精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

GPT-4.5智商測試94,登上LLM競技場榜首!網(wǎng)友質(zhì)疑黑幕,實測結(jié)果驚人

人工智能 新聞
在知名AI排行榜LM Arena中,曾全班墊底的GPT-4.5竟一度拿下第一?甚至在數(shù)學、編程等領(lǐng)域表現(xiàn)優(yōu)異,這反常的表現(xiàn)讓網(wǎng)友們一度質(zhì)疑:大模型競技場莫非被LLM操縱了?不過網(wǎng)友們在實測后卻驚訝發(fā)現(xiàn),GPT-4.5的確情商爆表,不用推理就能理解人類的深層意圖!

GPT-4.5,口碑又意外反轉(zhuǎn)了?

經(jīng)過3千多輪比較,GPT-4.5在全部類別拿下第一,位居LLM競技場首位!

「不看智商看情商」的GPT-4.5,不是推理模型,此前的基準測試中基本都是全班墊底,慘不忍睹。

結(jié)果一轉(zhuǎn)眼,它就在大模型競技場上登頂了??

剛剛,LLM  Arena排行榜官宣:GPT-4.5 在所有類別中都位居榜首,在風格控制、多輪對話方面獨占鰲頭,拿到了1411的總分。

在多輪對話、困難提示、編碼、數(shù)學、創(chuàng)意寫作、指令遵循、長查詢等領(lǐng)域都是第一!

這個結(jié)果,也太讓人意外了吧……

馬斯克立馬跳出來表示:GPT-4.5只是短暫的第一,并不會維持太久。

果然,馬斯克話音剛落不久,大模型競技場的TOP 1就成了Grok-3,總分1412,跟GPT-4.5的比分緊咬,差距極小。

但無論如何,曾經(jīng)登頂TOP 1的GPT-4.5,給人們留下了一串串的疑問:它不光情商高,讓人如沐春風,而且絕頂聰明,睥睨群雄,天下第一,吊打o1、Grok-3、Clauede等前輩???

主打一個「高情商」的GPT-4.5,純靠情商就能拿下編程、數(shù)學等領(lǐng)域第一嗎?

現(xiàn)在,已經(jīng)直接有網(wǎng)友開始質(zhì)疑:大模型競技場是不是有什么問題了。

甚至還有人猜測:LLM是不是已經(jīng)學會操縱LMArena了?

GPT-4.5智商結(jié)果公布:得分94排名第五

就在同時,GPT-4.5的智商測試結(jié)果也公布了。

可以看到,GPT-4.5的線下測試智商為97,線上門薩測試智商為94。

總之,無論是線上還是線下智商測試,GPT-4.5的得分都沒有OpenAI的o1 Pro、o3 mini和o1-preview高。

這個結(jié)果,總算是合理了些。

而在眾多大模型中,線下智商測試得分最高的是OpenAI o1 pro,線上門薩智商測試得分最高的是OpenAI o1。

但要和人類比的話,GPT-4o可以說已經(jīng)和人類的智商齊平。

人類的平均智商,大概在90到110。愛因斯坦的智商約為160,而陶哲軒被認為世界上智商最高的人,得分在225到230之間。

人類的智商被LLM超越,應該也就是近在咫尺的事了。

然而也有很多人質(zhì)疑了:給LLM測智商,到底意義幾何呢?

原因在于,智商是一個和人類心智獨特性相關(guān)的度量,不可能與LLM相關(guān)。

網(wǎng)友實測驚喜:它很理解用戶意圖!

最近,奧特曼就曬出了自己和GPT-4.5對話的記錄。

他提問道:「奇點臨近,未知在哪一側(cè)」,你如何看待?

GPT-4.5意味深長地答道:我們已經(jīng)超越了奇點的事件視界,但只是剛剛越過。

我們已踏入奇點的引力范圍,但要理解它的后果,依然為時尚早。

顯然,奧特曼對于GPT-4.5的表現(xiàn)非常滿意。

而就在這些天的實測中,許多網(wǎng)友也發(fā)現(xiàn),GPT-4.5擁有一種超凡的自我意識,在理解用戶意圖上令人驚喜。

比如下面這個例子中,用戶就開了一個關(guān)于國際象棋的粗俗玩笑,GPT-4.5沒有任何困難地就接住了這個梗,并且給出了適宜的回答。

這位AI大V表示,自己對此印象太深刻了!因為GPT-4.5在完全沒有經(jīng)過任何思考token的情況下,就抓住了這個微妙之處。

他感慨道:預訓練并沒有過時,只是在某些領(lǐng)域收益遞減了,但在其他領(lǐng)域卻得到了驚人的提升!

相比之下,對于這句讓LLM很難理解的人類粗俗玩笑,Claude Sonnet很顯然并沒有理解。

同樣,Grok 3也沒有g(shù)et到這句話的意思。

對此,不服氣的馬斯克還出現(xiàn)在了評論區(qū),貼上了Grok 3的回復,力證它并沒有落后。

GPT-4.5并非文武雙全

仔細看競技場排名,目前在「語言」(language)選項上,UB排名第一的是Grok-3-Preview-02-24,得分1412,共3364次投票。

GPT-4.5-Preview的UB排名第二,得分1411,只在「風格控制」(StyleCtrl)上排名第一,共3224次投票。

· UB排名:模型的排名上限,由統(tǒng)計上優(yōu)于目標模型的數(shù)量加一確定。當模型A的95%置信區(qū)間下限分數(shù)高于模型B的上限分數(shù)時,認為模型A在統(tǒng)計上優(yōu)于模型B。

· 風格控制排名:考慮了響應長度和Markdown使用等影響因素的模型排名,從而將模型性能與潛在的混淆因素分離。

「綜合」(Overall)選項上,Grok-3和GPT-4.5排名并列第一,后者在部分項目上有微弱優(yōu)勢。

在編程(coding)和數(shù)學(math)上,GPT-4.5的確和Grok-3并列第一。

按不同語言分類,Grok-3和GPT-4.5在英文、中文、德文等語言上并列第一。

此外DeepSeek-R1在中文上也是第一。

WebDev Arena是實時進行的AI編程競賽,各個模型在「網(wǎng)頁開發(fā)」挑戰(zhàn)中直接對決,GPT-4.5壓根沒參賽!

而且OpenAI的模型表現(xiàn)并非佳,最好的o3-mini-high與Early-grok-3并列第4,落后與Claude 3.7 Sonnet、Claude 3.5 Sonnet以及DeepSeek-R1。

GPT-4.5新王登基?測試讓人大跌眼鏡

對于GPT-4.5,某研究者也發(fā)表了一篇博客,來對它詳細進行了剖析。

GPT-4.5在社區(qū)中引發(fā)了褒貶不一的反應。

盡管前期進行了大肆炒作,該模型卻未能完全達到人們的高期望。

一些測試結(jié)果讓人大跌眼鏡。

Karpathy的測試表明,在五分之四的情況下,用戶更傾向于GPT-4o的回答。

盡管GPT-4.5被宣傳為更具創(chuàng)意和情商,但在實際的用戶體驗中,這些優(yōu)勢并沒有充分體現(xiàn)出來。

甚至有用戶反饋,在創(chuàng)意寫作方面,GPT-4.5的表現(xiàn)不如之前的模型。

此外,高昂的使用成本也成為了推廣GPT-4.5的一大障礙。

與GPT-4o相比,GPT-4.5的API價格大幅上漲:輸入token價格從每百萬2.50美元漲到了75美元,輸出token價格從每百萬10美元漲到了150美元。

用戶對GPT-4.5的高價普遍表示難以接受,一些網(wǎng)友直言「只是為了感覺更有氛圍而花75美元」。

對于小型公司和獨立開發(fā)者來說,如此高昂的成本無疑是一個巨大的負擔,影響了GPT-4.5的廣泛應用。

GPT-4.5的高價格可能反映了背后的資源約束。

Altman表示,盡管公司希望同時推出GPT-4.5 Plus和Pro版本,但GPU資源已經(jīng)用盡,計劃在下周增加數(shù)萬個GPU,然后才能推廣到Plus用戶。

盡管GPT-4.5在某些方面取得了明顯的進步,許多人期望的全面改進卻并未實現(xiàn)。

由于其龐大的規(guī)模和復雜的架構(gòu),GPT-4.5的響應速度更慢,降低了用戶體驗。

Sam Altman對GPT-4.5的高調(diào)宣傳,抬高了人們的期望,他將其描述為第一個「真正讓人感受到AGI」的時刻。

如果現(xiàn)實未能達到預期,這種宣傳也會像回旋鏢一樣對他不利。

為什么現(xiàn)在發(fā)布GPT-4.5?

與GPT-4兩年前的盛大發(fā)布相比,GPT-4.5的發(fā)布出奇地低調(diào)簡約,令許多人感到意外。

Sam Altman沒有親自出席這次發(fā)布會,這引發(fā)了外界對OpenAI對GPT-4.5的重視程度和信心的疑問。

GPT-4.5的目標受眾主要是廣大的普通用戶,借助AI完成撰寫郵件、總結(jié)文章等任務。

GPT-4.5是OpenAI從GPT-4o向GPT-5過渡的關(guān)鍵橋梁,成為了創(chuàng)意、溝通和解決實際問題的日常伙伴。

OpenAI明確表示,GPT-4.5并非旨在取代GPT-4o,這一表態(tài)進一步增加了市場對GPT-4.5未來的不確定性。

對許多人來說,ChatGPT就是AI的代名詞,再加上OpenAI對AGI的大力炒作,提高了人們對新模型的期待。

GPT-4.5發(fā)布的原因可能是市場競爭加劇。

短時間內(nèi),越來越多更好的模型進入市場。DeepSeek R1可以與GPT-4o相媲美,xAI的Grok 3看起來幾乎像人類,OpenAI面臨著巨大的壓力。

GPT-5預計在幾個月內(nèi)發(fā)布,首次在模型中結(jié)合推理和非推理組件,可以自主決定對查詢的反應強度,即「推理擴展」。

GPT-4.5是戰(zhàn)略性回應,目標是留住付費用戶,防止其在GPT-5發(fā)布前轉(zhuǎn)向競爭對手,保持OpenAI在市場中的領(lǐng)先地位。

責任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2025-02-28 09:00:00

2024-04-22 08:40:00

LLM模型開源

2012-05-31 14:20:14

2024-05-20 15:25:47

2025-03-03 07:39:23

2024-08-08 13:03:46

2025-04-16 09:30:16

2023-12-18 15:08:00

GPTOpenAI泄露

2025-02-17 12:24:43

2024-05-06 08:25:00

2025-07-03 14:57:51

DeepSeek模型AI

2025-03-05 08:50:00

模型AI數(shù)據(jù)

2025-04-07 09:35:00

Meta模型開源

2013-09-12 11:17:02

2025-04-14 09:06:00

2024-12-31 12:35:46

2024-05-31 14:23:15

2025-02-13 08:38:42

2024-03-08 13:02:56

Claude 3GPT-4Opus

2024-07-24 12:40:44

點贊
收藏

51CTO技術(shù)棧公眾號

亚洲色图制服诱惑| 中文欧美日韩| 日韩免费视频线观看| 99久久久精品视频| 视频在线不卡| 日韩精品亚洲一区| 欧美人成在线视频| 中文字幕国产专区| 国产欧美日韩电影| 欧美日韩美女视频| 一区二区三区不卡在线| 精品人妻伦一二三区久久| 亚洲欧美日韩国产| 久久久成人av| 在线观看日本中文字幕| 91精品国产一区二区在线观看 | 日本中文字幕一区二区有限公司| 色噜噜亚洲精品中文字幕| 无码人妻一区二区三区精品视频| 自拍偷拍欧美视频| 亚洲视频小说图片| 品久久久久久久久久96高清| 国产毛片毛片毛片毛片| 一本久久综合| 欧美夫妻性生活视频| 免费成人深夜天涯网站| 黄色欧美在线| 日韩一区二区视频| 污片在线免费看| 蜜桃视频在线观看免费视频| 亚洲婷婷综合色高清在线| 国模精品娜娜一二三区| 国产模特av私拍大尺度| 日本特黄久久久高潮| 5278欧美一区二区三区| 国产精品免费人成网站酒店| 亚洲精华一区二区三区| 精品少妇一区二区三区在线播放 | 国产精品1区二区.| 欧美又大粗又爽又黄大片视频| 免费视频网站www| 97精品一区二区| 亚洲欧美自拍一区| 网站免费在线观看| 大香伊人久久精品一区二区| 日韩一区二区免费在线观看| www.com黄色片| 欧美国产日韩电影| 91久久国产最好的精华液| 国产一区二区视频播放| www在线观看播放免费视频日本 | 欧美日韩中文字幕在线观看| 天天做天天爱天天综合网| 亚洲午夜小视频| 无码人妻精品一区二区三应用大全| 波多野结衣欧美| 精品国产亚洲一区二区三区在线观看| 天天摸天天舔天天操| 不卡精品视频| 91精品国产91久久久久久最新毛片| 亚洲免费av一区| 国产美女亚洲精品7777| 欧美电视剧在线看免费| 久久久男人的天堂| 久久国产精品色av免费看| 亚洲国内精品在线| 亚洲熟妇无码av| 国产欧美日韩在线一区二区| 在线播放国产一区中文字幕剧情欧美 | 国产精品一二三四五| 97av自拍| 亚洲国产999| 99精品视频在线播放观看| 精品欧美日韩在线| 日本黄在线观看| 国产欧美日本一区二区三区| 亚洲天堂电影网| www免费视频观看在线| 亚洲国产视频一区二区| 拔插拔插海外华人免费| 国精产品一区一区三区mba下载| 午夜私人影院久久久久| 日本免费黄视频| 国产成人精品一区二区三区视频| 欧美高清你懂得| 在线观看成人动漫| 国产精品一区二区三区av麻| 久久五月天综合| 精品国产免费观看| 日本女优在线视频一区二区| 亚洲最大福利网| 你懂的在线播放| 亚洲男同1069视频| 日本三级免费观看| 自拍偷拍亚洲图片| 日韩精品免费在线视频| 日日碰狠狠添天天爽| 亚洲激情偷拍| 国产欧美在线视频| 日本黄色大片视频| 国产精品免费视频一区| 美女扒开大腿让男人桶| 欧美日韩精品一区二区三区视频| 欧美一区二区三区免费视频| 日本黄色网址大全| 综合天堂av久久久久久久| 日本精品视频在线观看| 国产v片在线观看| 久久精品欧美一区二区三区麻豆| 国内自拍中文字幕| 日韩av超清在线观看| 精品精品国产高清a毛片牛牛| 国产精品天天干| 狠狠爱www人成狠狠爱综合网| 国产精品狼人色视频一区| av中文字幕播放| 日本一区二区三区dvd视频在线| 欧美交换配乱吟粗大25p| 青青热久免费精品视频在线18| 欧美tk丨vk视频| 亚洲一二三在线观看| 国产一区二区精品| 国产v亚洲v天堂无码| 亚洲s色大片| 欧美丝袜一区二区| 成人欧美精品一区二区| 91精品国产调教在线观看| 国产成人综合精品| 色播色播色播色播色播在线| 一区二区三区日韩精品| 91亚洲精品久久久蜜桃借种| 深夜福利久久| 日本成人精品在线| 香蕉国产在线视频| 亚洲午夜久久久久久久久久久 | 国产人妖乱国产精品人妖| www精品久久| 成人搞黄视频| 欧美激情精品久久久久久久变态| 国产乱淫a∨片免费观看| 国产精品色在线| 麻豆三级在线观看| 精品一区电影| 国产精品91久久久| 韩国三级在线观看久| 色综合色狠狠综合色| 国产肉体xxxx裸体784大胆| 亚洲大胆在线| 国产精品一区二区三区免费| av网站导航在线观看免费| 在线综合视频播放| 男的操女的网站| 国产一区二区女| 粉嫩av一区二区三区天美传媒| 成人在线啊v| 欧美精品中文字幕一区| 国产夫绿帽单男3p精品视频| 亚洲精品日韩综合观看成人91| 中文字幕12页| 欧美三级乱码| 国产高清在线一区二区| www.综合网.com| 亚洲国产另类 国产精品国产免费| 日韩精品一区二区三区国语自制| 91丝袜国产在线播放| 亚洲欧洲日产国码无码久久99| 欧美欧美黄在线二区| 国产精品高清免费在线观看| 欧美黄色激情| 精品久久久久一区| 精品人妻一区二区三区免费看 | 欧美91在线|欧美| 久久久精品国产亚洲| 亚洲第一页综合| 色呦呦国产精品| 美女100%露胸无遮挡| 久久精品国产久精国产爱| 女人色极品影院| 中文字幕中文字幕精品| 国产欧美亚洲精品| 秋霞在线午夜| 亚洲欧美日韩中文在线| 亚洲天堂网视频| 亚洲电影激情视频网站| xxxxx在线观看| 国产呦精品一区二区三区网站| 久久男人资源站| 国产精品一区二区三区av麻| 91黄在线观看| 黄瓜视频成人app免费| 久久精品99无色码中文字幕| 黑人精品一区二区| 在线观看日韩国产| 久久午夜无码鲁丝片午夜精品| 久久久天堂av| 日本中文字幕精品| 快she精品国产999| 隔壁人妻偷人bd中字| 欧美一区二区性| 国产精品一区二区三区免费观看| 日本黄色一区| 97精品视频在线观看| 男人的天堂在线视频免费观看 | 亚洲欧美丝袜| 欧美在线关看| av免费精品一区二区三区| 欧美片第1页| 久久久久久国产精品久久| av在线收看| 日韩精品在线免费| 精品人妻少妇AV无码专区| 欧美亚洲综合在线| 中文字幕亚洲精品在线| 成人免费在线观看入口| 三上悠亚影音先锋| www.av亚洲| 蜜臀aⅴ国产精品久久久国产老师| 久久久精品网| 亚洲熟妇无码另类久久久| 1024精品久久久久久久久| 日韩精品欧美专区| 香蕉久久精品日日躁夜夜躁| 999久久久| 99久久这里有精品| 国产精品丝袜一区二区三区| 涩涩av在线| 久久久久久久一区二区| aaa大片在线观看| 久久精品国产96久久久香蕉| 成人免费黄色网页| 亚洲男人7777| 免费在线观看污视频| 亚洲福利在线视频| 国产 日韩 欧美 精品| 日韩一级成人av| 国产乱码精品一区二区| 欧美日韩国产另类不卡| 自拍偷拍精品视频| 在线亚洲精品福利网址导航| 69国产精品视频免费观看| 精品国产999| 久久久久久久伊人| 亚洲国产aⅴ天堂久久| 久久久久久久福利| 亚洲自拍偷拍欧美| 国产一级一片免费播放| 亚洲成人av资源| 懂色av.com| 日韩欧美精品网址| 一本一道无码中文字幕精品热| 黑人巨大精品欧美一区二区| 久久精品视频7| 在线观看一区二区视频| 中文字幕日韩三级| 欧美日韩欧美一区二区| 亚洲性生活大片| 91精品国产色综合久久不卡蜜臀| 国产视频手机在线| 日韩免费福利电影在线观看| 狠狠躁日日躁夜夜躁av| 亚洲国产精品久久91精品| 桃花色综合影院| 日韩高清有码在线| 国产乱子伦三级在线播放| 色妞色视频一区二区三区四区| 免费在线观看黄色| 欧美多人爱爱视频网站| jizz一区二区三区| 日韩女优在线播放| 四虎国产精品免费久久5151| 96pao国产成视频永久免费| 中文字幕一区二区三区日韩精品| 国产精品一区视频网站| 国产99亚洲| 免费在线观看污污视频| 黑人一区二区| 欧美午夜性生活| 国产精品中文有码| 免费成人蒂法网站| 中文字幕av一区二区三区高| 免费看一级大片| 欧美日韩午夜剧场| 一区两区小视频| 亚洲精品一区二区三区99| 精彩国产在线| 久精品免费视频| 三级成人在线| 不卡视频一区二区三区| 精品一区免费| 日韩不卡视频一区二区| 国产精品久久久久久久久久妞妞 | 免费看日本黄色| 久久综合九色| 91人妻一区二区| 国产精品视频第一区| 国语对白一区二区| 欧美日韩国产一级二级| 欧美自拍偷拍一区二区| 三级精品视频久久久久| av丝袜在线| 成人av在线天堂| 国产精品亚洲片在线播放| 好吊色视频988gao在线观看| 天使萌一区二区三区免费观看| 亚洲av无一区二区三区久久| 欧美激情综合网| 日本一级一片免费视频| 欧美精品1区2区| 国产美女性感在线观看懂色av | 激情开心成人网| yellow视频在线观看一区二区 | 国产欧美一区二区三区网站 | 一区二区毛片| 日韩高清一二三区| 国产精品久久久久毛片软件| 久久99精品波多结衣一区| 日韩欧美视频一区| 欧美18hd| 国产免费一区二区三区在线能观看| 欧美尿孔扩张虐视频| 成人在线免费观看视频网站| 麻豆精品精品国产自在97香蕉| 一区二区三区免费在线观看视频| 亚洲永久精品国产| 国产女人18毛片18精品| 色妞欧美日韩在线| 九七影院97影院理论片久久| 欧美黑人xxxxx| 午夜在线视频观看日韩17c| 激情av中文字幕| 亚洲一区二区高清| 精品久久无码中文字幕| 另类视频在线观看| 成人乱码手机视频| 一区二区三区四区欧美日韩| 青青草视频一区| gv天堂gv无码男同在线观看| 色欧美片视频在线观看| 黄色在线观看网| 国产成人av网| 欧美肉体xxxx裸体137大胆| 日韩在线第三页| 国产女主播在线一区二区| 好吊色在线视频| 国产亚洲a∨片在线观看| 欧美天堂视频| 亚欧洲精品在线视频免费观看| 日韩精品亚洲专区| 中文字幕黄色网址| 欧美日韩国产综合视频在线观看| a√在线中文网新版址在线| 国产精品普通话| 水蜜桃精品av一区二区| 亚洲一二区在线观看| 亚洲精品国产第一综合99久久| 国产aⅴ一区二区三区| 欧美激情视频网| 日韩av影院| 91看片在线免费观看| 成人免费一区二区三区在线观看| 国产麻豆免费视频| 亚州精品天堂中文字幕| 欧美一级全黄| 色婷婷成人在线| 亚洲久草在线视频| 色窝窝无码一区二区三区| 国产91九色视频| 999国产精品永久免费视频app| 色黄视频免费看| 亚洲h动漫在线| 国产色a在线| 91文字幕巨乱亚洲香蕉| 99这里有精品| 亚洲一级片在线播放| 日韩亚洲欧美在线| 僵尸再翻生在线观看| 午夜欧美性电影| 国产69精品久久久久777| 久久久久久久久久免费视频 | 久久精品ww人人做人人爽| 久久激情网站| √天堂中文官网8在线| 亚洲国产精品久久| 成人免费一区| 精品国偷自产一区二区三区| 国产午夜亚洲精品午夜鲁丝片| 97人妻精品一区二区三区动漫| 午夜剧场成人观在线视频免费观看| 久久综合欧美| 麻豆av免费看| 欧美午夜不卡视频| 久草在线视频资源| 色99中文字幕| 国产91丝袜在线18| 中文字幕第31页| 91国内揄拍国内精品对白| 日韩久久精品| 美国黄色一级毛片| 日韩三级在线观看| 成人福利片在线|