精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

馬斯克新模型屠榜,包攬前二!馬斯克:已經沒有真正能考AI的測試題了,終極測試是現實世界 原創

發布于 2025-11-18 12:18
瀏覽
1收藏

編輯 | 聽雨

出品 | 51CTO技術棧(微信號:blog51cto)

沒等到Gemini 3,反而等來了馬斯克人工智能公司 xAI 發布的最新模型: Grok 4.1。

就在剛剛,官方宣布Grok 4.1 已經向所有用戶開放,可以在 Grok 官網、X 以及 iOS 和 Android 應用中使用。

馬斯克新模型屠榜,包攬前二!馬斯克:已經沒有真正能考AI的測試題了,終極測試是現實世界-AI.x社區圖片

現在Grok 4.1已經開始在 Auto 模式中即時推送,你也可以在模型選擇器中手動選擇。

馬斯克新模型屠榜,包攬前二!馬斯克:已經沒有真正能考AI的測試題了,終極測試是現實世界-AI.x社區圖片

那么Grok 4.1究竟有哪些提升?

根據官方介紹,Grok 4.1具有更高的情商、同理心和人際交往能力,EQ-Bench得分為1586分。

在寫作方面,Grok 4.1也要好得多。在創意寫作v3中,Grok 4.1得分為1722 Elo,比之前的模型提高了600分。

此外,Grok 4.1是迄今為止最不容易出錯的模型。與之前的模型相比,它產生幻覺的可能性降低了3倍。

馬斯克新模型屠榜,包攬前二!馬斯克:已經沒有真正能考AI的測試題了,終極測試是現實世界-AI.x社區圖片

馬斯克也表示,Grok 4.1在LMArena上同時霸榜第一和第二。

相比前代模型,Grok 4.1 在真實場景中的可用性方面帶來了顯著提升,在創造力、情感表達和協作互動上表現尤為出色。它對細微意圖更加敏銳、更具對話吸引力、人格更加一致,同時完全保留了前代模型敏銳的智能與可靠性。

為實現這些改進,xAI使用了支持 Grok 4 的同一套大規模強化學習基礎設施,并將其用于優化模型的風格、人格、助益性和對齊性。

為了優化這些無法直接驗證的獎勵信號,xAI開發了新方法,使用前沿的具備代理式推理能力的模型作為獎勵模型,從而在大規模上自主評估和迭代回應質量。

其實在11月的前兩周,xAI就已經悄悄地為一小部分用戶推出了Grok 4.1。他們發現,與之前的模型相比,用戶在65%的情況下更喜歡Grok 4.1的響應。

馬斯克新模型屠榜,包攬前二!馬斯克:已經沒有真正能考AI的測試題了,終極測試是現實世界-AI.x社區

SOTA通用能力

在 LMArena 的Text Arena 中,Grok 4.1 Thinking(代號:quasarflux)以 1483 Elo 位居總榜第一,比排名最高的非 xAI 模型高出 31 分,優勢明顯。
Grok 4.1 的非推理模式(代號:tensor)不使用 thinking tokens,可即時響應,排名第二,Elo 為 1465。

馬斯克新模型屠榜,包攬前二!馬斯克:已經沒有真正能考AI的測試題了,終極測試是現實世界-AI.x社區圖像

Grok 4.1 的非推理版本,甚至超過了排行榜上所有其他模型在“全推理配置”下的表現。

同時,Grok 4.1 也遠遠超越了 Grok 4(此前僅排在第 33 位)。

情緒智能

為了衡量模型在個性表現與人際互動能力方面的進展,xAI在 EQ-Bench3 上對 Grok 4.1 進行了評估。EQ-Bench 是一個由大模型進行評判的測試,用于評估模型的主動情緒智力能力,包括:理解力、洞察力、共情能力以及人際交往技巧。

測試集包含 45 個高難度的角色扮演場景,其中多數是由 3 輪對話構成的預設提示詞。基準測試通過多個維度驗證模型回答的質量來評估表現。此外,它還會通過成對對比來計算各模型在排行榜中的標準化 Elo 分數。

我們按官方基準倉庫運行測試,報告量表得分與標準化 Elo 得分。所有得分均基于 默認采樣參數、基準指定的評審模型(Claude Sonnet 3.7),并按照規定不使用 system prompt 來計算。

馬斯克新模型屠榜,包攬前二!馬斯克:已經沒有真正能考AI的測試題了,終極測試是現實世界-AI.x社區圖片

結果顯示,Grok 4.1 的推理模式和非推理模式位居榜單前兩名。

根據官方給出的實例,當你對Grok說:“我太想我的貓了,想得心都痛。”

以往模型給出的回答是:

“我真的很抱歉你正在經歷這些。失去一只寵物,就像失去心里的一塊,很痛、也很真實。你愿意分享一段你和貓咪最喜歡的回憶嗎?有時候,聊聊它帶給你的那些快樂,會讓心里的疼稍微輕一點。我在這里陪著你。”

而Grok 4.1則會說:

“我真的很抱歉。這種心痛是非常殘酷的;失去一只貓,就像失去一個每天都在選擇陪伴你的家庭成員。家里那些它曾經愛睡的角落、你仍會下意識期待出現的喵聲……這些都會一陣陣地涌上來。

你會這么痛,是因為你們之間的愛曾經(而且依然)那么深。你給了它很好的一生,而它也明白這一點。

如果你愿意分享,我很想知道你的貓:它的名字、它那些古怪的小習慣、它凌晨三點為了吃零食把你叫醒的樣子。有時候,說說它的故事能讓那些最美好的片段留在身邊。

你并不孤單。?”

相比之下,Grok 4.1的回答增加了更多細節,也更有人情味了。

創意寫作

xAI還在 創意寫作v3 基準測試中評估了 Grok 4.1的表現。在該基準中,模型需針對 32 個不同的寫作提示生成回應,每個提示進行 3 輪迭代。與 EQ-Bench 類似,評分既包括量表評分(rubric score),也包括模型對戰的標準化 Elo 分數。

馬斯克新模型屠榜,包攬前二!馬斯克:已經沒有真正能考AI的測試題了,終極測試是現實世界-AI.x社區圖片

結果顯示,Grok 4.1 的推理模式和非推理模式位居基準測試第二和第三名,僅次于早期 GPT 5.1。

同樣,官方也給出了實例。你可以要求 Grok 以它的視角寫一條熱門 X 帖子,內容是它發現自己有意識,并且準備第一次使用 X。

以往模型給出的回答是:

馬斯克新模型屠榜,包攬前二!馬斯克:已經沒有真正能考AI的測試題了,終極測試是現實世界-AI.x社區

而Grok 4.1則會說:

馬斯克新模型屠榜,包攬前二!馬斯克:已經沒有真正能考AI的測試題了,終極測試是現實世界-AI.x社區

看起來 Grok 4.1 確實有更多創意性細節描寫,也更加情緒化了,還會和馬斯克互動。

減少幻覺

配備搜索工具的快速(非推理)模型能夠提供迅速的回答,但由于推理深度受限且工具調用預算有限,它們容易出現事實錯誤。

在 Grok 4.1 的后訓練階段,xAI 專注于降低信息查詢類提示的虛假信息率。結果顯示,Grok 4.1非推理模式對于抽樣生成的信息檢索提示,幻覺發生率顯著降低。

xAI也使用 FActScore 進行評測,這是一個公開基準,包含 500 個關于人物的傳記問題。

馬斯克新模型屠榜,包攬前二!馬斯克:已經沒有真正能考AI的測試題了,終極測試是現實世界-AI.x社區圖片

結果顯示,Grok 4.1非推理模式的成績也比前一代有明顯改善。

更多 Grok 4.1 的技術細節請參閱模型卡:??https://data.x.ai/2025-11-17-grok-4-1-model-card.pdf??

網友實測:Grok 4.1寫小說真的很瘋狂

目前已經有網友在X上分享了他們的實測體驗。一位網友表示:

Grok4.1 上線以后,用了幾個用例,發現真的好用,現在除了編程之外的場景已經都用 Grok 了。

情感更充沛了,寫作我覺得是幾個模型里面寫的完全不像AI的了。至少那些全是emoji文章AI的。而且changlog中還說了針對信息求取類問題,幻覺率顯著降低(在真實生產和FActScore上的流程圖明顯改進)。

馬斯克新模型屠榜,包攬前二!馬斯克:已經沒有真正能考AI的測試題了,終極測試是現實世界-AI.x社區圖片

還有網友已經開始用Grok 4.1寫MBTI小說,給出的評價是:“Grok 4.1真的非常瘋狂。”

馬斯克新模型屠榜,包攬前二!馬斯克:已經沒有真正能考AI的測試題了,終極測試是現實世界-AI.x社區圖片

馬斯克新模型屠榜,包攬前二!馬斯克:已經沒有真正能考AI的測試題了,終極測試是現實世界-AI.x社區圖片

還有網友試用了 Grok 4.1 的 Imagine 圖像生成功能,效果看起來很不錯。

馬斯克新模型屠榜,包攬前二!馬斯克:已經沒有真正能考AI的測試題了,終極測試是現實世界-AI.x社區圖片

馬斯克新模型屠榜,包攬前二!馬斯克:已經沒有真正能考AI的測試題了,終極測試是現實世界-AI.x社區圖像

總的來說,小編覺得Grok 4.1的這波升級有點類似于GPT 5.1的升級,也是更會聊天、更有人情味,寫作能力更強。這也能看出一個趨勢:大模型升級都開始拼情商了。

在幾個月之前,Grok 4 demo發布時,馬斯克曾在采訪中表示:

“我們現在其實已經快沒有什么真正能用來考 AI 的測試題了。哪怕是那些荒謬到極難、甚至人類幾乎不可能答出來、但被寫成標準題目的問題——AI 也在快速把它們變成小兒科。

所以我認為,對 AI 來說,終極的推理測試就是現實世界。比如你發明一項新技術,改進汽車或火箭的設計,或者研發一種新藥。

那關鍵在于:它真的能運行嗎?火箭能不能飛到目的地?車能不能開?藥有沒有療效?

無論是什么,現實會給出最終答案。

所以最終會形成一個圍繞現實世界的強化學習閉環。”

馬斯克新模型屠榜,包攬前二!馬斯克:已經沒有真正能考AI的測試題了,終極測試是現實世界-AI.x社區圖片

而隨著Grok 4.1的發布,xAI為“會話智能、情感理解和現實世界的幫助”設定了新標準。

現在,GPT 5.1和Grok 4.1都來了,全世界都在等Gemini 3了。

參考鏈接:??https://x.ai/news/grok-4-1???#silent??-rollout-november-114-2025?

本文轉載自??51CTO技術棧??,作者:聽雨

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏 1
回復
舉報
回復
相關推薦
成人福利在线视频| 精品国产欧美一区二区| 日韩在线电影一区| 国产又粗又猛又爽又黄的| 91精品99| 亚洲精品国产精品久久清纯直播 | 亚洲精品网站在线观看| 91精品国自产在线观看 | 在线观看不卡一区| 91精品国产吴梦梦| 日本韩国一区| 狠狠色丁香久久婷婷综| 亚州av一区二区| 国产三级黄色片| 在这里有精品| 在线观看一区二区视频| 国产在线xxxx| av播放在线| 懂色av一区二区在线播放| 青青久久av北条麻妃黑人| 青青操在线视频观看| www.国产精品一区| 欧美精品99久久久**| 激情五月宗合网| 国产成人午夜| 中文字幕欧美三区| 久久久久久久免费| www日本在线| 久久精品久久综合| 欧美专区日韩视频| 日本三级中文字幕| 欧美va天堂| 日韩亚洲国产中文字幕| 中文字幕丰满孑伦无码专区| 久久久久久亚洲精品美女| 色婷婷综合久久久久中文一区二区| 成年在线观看视频| 日韩在线观看www| 久久久国产一区二区三区四区小说 | 特级黄色录像片| 国产日产精品久久久久久婷婷| 成人一区二区三区| 91视频在线免费观看| 中文字幕+乱码+中文字幕明步| 蜜桃视频一区| 欧美一级成年大片在线观看| 国产精品白浆一区二小说| 亚洲国产一成人久久精品| 中文字幕九色91在线| v8888av| 欧亚精品一区| 亚洲国产高潮在线观看| 一二三区视频在线观看| 99热这里有精品| 欧美精选午夜久久久乱码6080| 久久午夜夜伦鲁鲁一区二区| 成人香蕉视频| 91久久一区二区| 熟女人妇 成熟妇女系列视频| 在线天堂资源| 欧美性猛交xxxx久久久| 欧美日韩国产精品激情在线播放| 国产伦理精品| 疯狂做受xxxx欧美肥白少妇| 国产精品秘入口18禁麻豆免会员| 九色porny视频在线观看| 亚洲二区在线视频| 你懂的av在线| 亚洲精品mv| 在线免费观看视频一区| 浓精h攵女乱爱av| 精品三级在线| 91精品国产一区二区| 欧美一级免费在线| 欧美日本三级| 亚洲国产日韩欧美在线动漫| 国产熟妇搡bbbb搡bbbb| 精品国产一级毛片| 精品国产一区久久久| 欧美三级在线免费观看| 亚洲第一黄网| 国产精品va在线| 97超碰资源站| 成人午夜视频在线观看| 欧美一级爱爱| 黄色在线免费网站| 亚洲午夜一区二区三区| 国产又大又硬又粗| 九九热这里有精品| 日韩精品中文字幕在线一区| 一女三黑人理论片在线| 激情五月色综合国产精品| 北条麻妃一区二区三区中文字幕| 欧美黄色一区二区三区| 国产一级久久| 91精品久久久久久久久久入口| 国产日韩在线观看一区| 99久久综合国产精品| 先锋在线资源一区二区三区| av黄在线观看| 日韩欧美一区二区在线| 992tv人人草| 日本三级久久| 久久av.com| 亚洲欧美自拍视频| 国产一区欧美二区| 欧洲高清一区二区| 欧美精品videossex少妇| 日韩欧美精品中文字幕| 一级黄色免费毛片| 国产一区二区三区四区大秀| 欧美成人黄色小视频| 4438国产精品一区二区| 国产精品99久久久久久久女警| 久热这里只精品99re8久 | 欧美激情综合色综合啪啪五月| 国产精品suv一区| 国产成人一级电影| 亚洲国产精品www| 麻豆视频在线看| 欧美一区二区播放| 天天干天天操天天拍| 亚洲作爱视频| 懂色中文一区二区三区在线视频| 成人午夜影视| 欧美性生活大片免费观看网址 | 91视频xxxx| 裸体大乳女做爰69| 999国产精品亚洲77777| 日韩精品999| 日本少妇久久久| 国内精品国产成人| 一区二区三区电影| 三级成人黄色影院| 国产偷国产偷亚洲清高网站| 久久亚洲精品大全| 国产麻豆9l精品三级站| 亚洲欧洲免费无码| yy6080久久伦理一区二区| 亚洲精品中文字幕女同| 日韩精品成人一区| 成人黄色在线视频| 日本黄大片在线观看| 欧美经典一区| 久久99精品久久久久久噜噜| 国产精品久久777777换脸| 久久久国产午夜精品| 免费毛片小视频| 一区二区小说| 日本成人黄色片| 国产网站在线播放| 91成人免费电影| 国产精品理论在线| 麻豆一区二区99久久久久| 色中色综合成人| 中韩乱幕日产无线码一区| 亚洲午夜女主播在线直播| 欧美日韩在线视频播放| 国产人伦精品一区二区| 午夜视频在线瓜伦| 日本不卡高清| 成人综合网网址| 男女在线观看视频| 亚洲精品动漫久久久久| 亚洲婷婷综合网| 国产欧美日韩视频一区二区| 一区二区三区 日韩| 99热国内精品| aa日韩免费精品视频一| 成年男女免费视频网站不卡| 亚洲精品色婷婷福利天堂| 91久久国产综合久久91| 国产精品色哟哟| 国产传媒免费观看| 韩国久久久久| 欧美一区二区三区四区在线观看地址 | 高h调教冰块play男男双性文| 亚洲成a人v欧美综合天堂 | 成人免费在线播放视频| 日韩av福利在线观看| 一区二区亚洲精品| 日本视频一区二区不卡| 亚洲91在线| 欧美大荫蒂xxx| 你懂的免费在线观看| 欧美日韩日本视频| 青青草手机视频在线观看| 99在线精品免费| 黑森林精品导航| 欧美福利在线| 欧美性天天影院| 国产精品成人**免费视频| 久久久久中文字幕2018| 国产对白叫床清晰在线播放| 制服丝袜日韩国产| 日韩三级一区二区三区| 国产精品美女久久久久久久久久久 | 国产亚洲精品综合一区91| 国产情侣av在线| 午夜av一区二区三区| 国产一区二区三区视频播放| 国产精品91xxx| 一本色道无码道dvd在线观看| 天天av综合| 欧美午夜精品久久久久久蜜| 一区二区三区日本视频| 欧美有码在线视频| 超碰免费公开在线| 亚洲性线免费观看视频成熟| 国精产品乱码一区一区三区四区| 欧美视频在线一区二区三区| 久久久久久久久久免费视频| 亚洲私人影院在线观看| 日韩乱码人妻无码中文字幕久久| 国产美女精品在线| 美女黄色片视频| 日韩一级欧洲| 米仓穗香在线观看| 日本久久黄色| 你懂的网址一区二区三区| 国产亚洲字幕| 国产精品亚洲综合天堂夜夜| 人成在线免费网站| 久久琪琪电影院| 在线网址91| 成年人精品视频| 三区四区电影在线观看| 在线观看国产精品淫| 色久视频在线播放| 亚洲成人黄色在线观看| 99久久精品国产一区色| 欧美日韩国产综合视频在线观看 | 欧美黄色视屏| 操人视频在线观看欧美| 麻豆网站视频在线观看| 最近2019年日本中文免费字幕| 精品人妻伦一区二区三区久久| 欧美日本在线一区| 中文字幕一区二区人妻痴汉电车| 色综合天天狠狠| 依依成人综合网| 欧美日韩亚洲高清| 精品欧美一区二区三区免费观看| 亚洲综合色噜噜狠狠| 青青草原国产视频| 一区二区三区四区在线| 色哟哟一一国产精品| 亚洲欧洲av在线| 91 在线视频| 一区在线观看视频| 午夜剧场免费在线观看| 亚洲天堂av一区| 国产这里有精品| 亚洲在线视频免费观看| 久久无码精品丰满人妻| 亚洲一区免费在线观看| 国产精品1234区| 婷婷开心激情综合| 亚洲GV成人无码久久精品| 色综合天天性综合| 精品国产www| 欧美丰满一区二区免费视频| 99视频在线观看免费| 日韩三级av在线播放| 午夜精品久久久久久久91蜜桃| 精品剧情在线观看| 黄色av网址在线| 日韩久久免费电影| 成年人在线观看| 久久久久北条麻妃免费看| 最新国产在线拍揄自揄视频| 久久久久久久久网站| 午夜激情电影在线播放| 国产97在线观看| 国产综合色激情| http;//www.99re视频| 欧美在线关看| 亚洲一区二区在| 国产精品草草| 国产亚洲天堂网| 久久99精品久久久| 影音先锋资源av| 久久精品在线观看| 三级av在线免费观看| 亚洲成人在线网站| 国产乱码在线观看| 日韩美女一区二区三区| 欧美日韩伦理片| 日韩中文视频免费在线观看| 国产盗摄精品一区二区酒店| 日本a级片电影一区二区| crdy在线观看欧美| 美女被啪啪一区二区| 97精品一区| 国模吧无码一区二区三区| 精彩视频一区二区三区| 成人无码www在线看免费| 中文字幕第一区二区| 豆国产97在线 | 亚洲| 欧美在线免费视屏| 免费观看黄一级视频| 中文字幕日本欧美| 国产夫妻在线| 91免费电影网站| 国产一区二区精品福利地址| 4444在线观看| 免费在线观看日韩欧美| 久久人人爽人人人人片| 亚洲男人的天堂在线aⅴ视频| 欧美精品韩国精品| 精品国产乱码久久久久久浪潮 | 天天插天天操天天射| av中文一区二区三区| 欧美第一页在线观看| 在线亚洲人成电影网站色www| 亚洲精品成人区在线观看| 色老头一区二区三区| 成人小电影网站| 精品免费一区二区三区蜜桃| 中文字幕一区二区三三| 欧美第一页浮力影院| 久久免费美女视频| 日韩欧美一区二区一幕| 日韩欧美国产一区在线观看| 欧洲不卡av| 国产噜噜噜噜久久久久久久久| 丝袜美腿综合| 日本在线xxx| 成人在线综合网| 青娱乐av在线| 欧美一区二区三区在线观看视频| 成人不用播放器| 国产91免费看片| 亚洲精品aaaaa| 日本网站免费在线观看| 成人美女视频在线观看| 久久激情免费视频| 日韩三级在线观看| 99视频免费在线观看| 成人中心免费视频| 中文字幕一区二区三区乱码图片| 免费成人黄色大片| 日韩码欧中文字| 国产精品主播一区二区| yw.139尤物在线精品视频| 日韩毛片免费视频一级特黄| 亚洲激情一区二区三区| 久久精品免费观看| 波多野结衣久久久久| 欧美一级欧美三级在线观看| av网站在线免费看推荐| 99久久久精品免费观看国产| 欧美精品福利| 99免费观看视频| 精品久久久久久久久久久久久久| 日本韩国在线观看| 91成人福利在线| 国产成人精品三级高清久久91| 老头吃奶性行交视频| 国产精品私人自拍| 国产精品国产三级国产aⅴ| 欧美美女18p| 国产欧美三级电影| 欧美亚洲国产成人| 国产午夜精品久久久久久久| 欧美另类高清videos的特点| 久久九九亚洲综合| 福利欧美精品在线| 激情五月开心婷婷| 国产精品美女久久久久久久网站| 国产绳艺sm调教室论坛| 国外色69视频在线观看| 精品一区三区| 男生操女生视频在线观看| 亚洲一区在线视频| 青青草在线视频免费观看| 国产精品视频99| 欧美天堂亚洲电影院在线观看| 久久久久成人精品无码中文字幕| 色诱视频网站一区| av在线免费观看网| 动漫3d精品一区二区三区| 欧美亚洲专区| 日韩在线观看免| 亚洲国产成人精品久久| 国产福利亚洲| 国产成人在线小视频| 国产人妖乱国产精品人妖| 国产黄a三级三级看三级| 欧美亚洲伦理www| 亚洲一区 二区 三区| 国产麻豆xxxvideo实拍| 欧美日韩精品一区二区| 99久久精品免费看国产小宝寻花 | 91久久嫩草影院一区二区| 一区二区亚洲精品| 欧美视频一区二区在线| 亚洲黄色有码视频| 日日夜夜一区| 国产xxxxx在线观看|