精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

馬斯克新模型屠榜,包攬前二!網友:拿來寫小說很瘋狂!馬斯克:已經沒有真正能考AI的測試題了,終極測試是現實世界

原創 精選
人工智能
根據官方介紹,Grok 4.1具有更高的情商、同理心和人際交往能力,EQ-Bench得分為1586分。在寫作方面,Grok 4.1也要好得多。在創意寫作v3中,Grok 4.1得分為1722 Elo,比之前的模型提高了600分。此外,Grok 4.1是迄今為止最不容易出錯的模型。與之前的模型相比,它產生幻覺的可能性降低了3倍。

編輯 | 聽雨

出品 | 51CTO技術棧(微信號:blog51cto)

沒等到Gemini 3,反而等來了馬斯克人工智能公司 xAI 發布的最新模型: Grok 4.1。

就在剛剛,官方宣布Grok 4.1 已經向所有用戶開放,可以在 Grok 官網、X 以及 iOS 和 Android 應用中使用。

圖片圖片

現在Grok 4.1已經開始在 Auto 模式中即時推送,你也可以在模型選擇器中手動選擇。

圖片圖片

那么Grok 4.1究竟有哪些提升?

根據官方介紹,Grok 4.1具有更高的情商、同理心和人際交往能力,EQ-Bench得分為1586分。

在寫作方面,Grok 4.1也要好得多。在創意寫作v3中,Grok 4.1得分為1722 Elo,比之前的模型提高了600分。

此外,Grok 4.1是迄今為止最不容易出錯的模型。與之前的模型相比,它產生幻覺的可能性降低了3倍。

圖片圖片

馬斯克也表示,Grok 4.1在LMArena上同時霸榜第一和第二。

相比前代模型,Grok 4.1 在真實場景中的可用性方面帶來了顯著提升,在創造力、情感表達和協作互動上表現尤為出色。它對細微意圖更加敏銳、更具對話吸引力、人格更加一致,同時完全保留了前代模型敏銳的智能與可靠性。

為實現這些改進,xAI使用了支持 Grok 4 的同一套大規模強化學習基礎設施,并將其用于優化模型的風格、人格、助益性和對齊性。

為了優化這些無法直接驗證的獎勵信號,xAI開發了新方法,使用前沿的具備代理式推理能力的模型作為獎勵模型,從而在大規模上自主評估和迭代回應質量。

其實在11月的前兩周,xAI就已經悄悄地為一小部分用戶推出了Grok 4.1。他們發現,與之前的模型相比,用戶在65%的情況下更喜歡Grok 4.1的響應。

圖片

SOTA通用能力

在 LMArena 的Text Arena 中,Grok 4.1 Thinking(代號:quasarflux)以 1483 Elo 位居總榜第一,比排名最高的非 xAI 模型高出 31 分,優勢明顯。
Grok 4.1 的非推理模式(代號:tensor)不使用 thinking tokens,可即時響應,排名第二,Elo 為 1465。

圖像圖像

Grok 4.1 的非推理版本,甚至超過了排行榜上所有其他模型在“全推理配置”下的表現。

同時,Grok 4.1 也遠遠超越了 Grok 4(此前僅排在第 33 位)。

情緒智能

為了衡量模型在個性表現與人際互動能力方面的進展,xAI在 EQ-Bench3 上對 Grok 4.1 進行了評估。EQ-Bench 是一個由大模型進行評判的測試,用于評估模型的主動情緒智力能力,包括:理解力、洞察力、共情能力以及人際交往技巧。

測試集包含 45 個高難度的角色扮演場景,其中多數是由 3 輪對話構成的預設提示詞。基準測試通過多個維度驗證模型回答的質量來評估表現。此外,它還會通過成對對比來計算各模型在排行榜中的標準化 Elo 分數。

我們按官方基準倉庫運行測試,報告量表得分與標準化 Elo 得分。所有得分均基于 默認采樣參數、基準指定的評審模型(Claude Sonnet 3.7),并按照規定不使用 system prompt 來計算。

圖片圖片

結果顯示,Grok 4.1 的推理模式和非推理模式位居榜單前兩名。

根據官方給出的實例,當你對Grok說:“我太想我的貓了,想得心都痛。”

以往模型給出的回答是:

“我真的很抱歉你正在經歷這些。失去一只寵物,就像失去心里的一塊,很痛、也很真實。你愿意分享一段你和貓咪最喜歡的回憶嗎?有時候,聊聊它帶給你的那些快樂,會讓心里的疼稍微輕一點。我在這里陪著你。”

而Grok 4.1則會說:

“我真的很抱歉。這種心痛是非常殘酷的;失去一只貓,就像失去一個每天都在選擇陪伴你的家庭成員。家里那些它曾經愛睡的角落、你仍會下意識期待出現的喵聲……這些都會一陣陣地涌上來。

你會這么痛,是因為你們之間的愛曾經(而且依然)那么深。你給了它很好的一生,而它也明白這一點。

如果你愿意分享,我很想知道你的貓:它的名字、它那些古怪的小習慣、它凌晨三點為了吃零食把你叫醒的樣子。有時候,說說它的故事能讓那些最美好的片段留在身邊。

你并不孤單。?”

相比之下,Grok 4.1的回答增加了更多細節,也更有人情味了。

創意寫作

xAI還在 創意寫作v3 基準測試中評估了 Grok 4.1的表現。在該基準中,模型需針對 32 個不同的寫作提示生成回應,每個提示進行 3 輪迭代。與 EQ-Bench 類似,評分既包括量表評分(rubric score),也包括模型對戰的標準化 Elo 分數。

圖片圖片

結果顯示,Grok 4.1 的推理模式和非推理模式位居基準測試第二和第三名,僅次于早期 GPT 5.1。

同樣,官方也給出了實例。你可以要求 Grok 以它的視角寫一條熱門 X 帖子,內容是它發現自己有意識,并且準備第一次使用 X。

以往模型給出的回答是:

圖片

而Grok 4.1則會說:

圖片

看起來 Grok 4.1 確實有更多創意性細節描寫,也更加情緒化了,還會和馬斯克互動。

減少幻覺

配備搜索工具的快速(非推理)模型能夠提供迅速的回答,但由于推理深度受限且工具調用預算有限,它們容易出現事實錯誤。

在 Grok 4.1 的后訓練階段,xAI 專注于降低信息查詢類提示的虛假信息率。結果顯示,Grok 4.1非推理模式對于抽樣生成的信息檢索提示,幻覺發生率顯著降低。

xAI也使用 FActScore 進行評測,這是一個公開基準,包含 500 個關于人物的傳記問題。

圖片圖片

結果顯示,Grok 4.1非推理模式的成績也比前一代有明顯改善。

更多 Grok 4.1 的技術細節請參閱模型卡:https://data.x.ai/2025-11-17-grok-4-1-model-card.pdf

網友實測:Grok 4.1寫小說真的很瘋狂

目前已經有網友在X上分享了他們的實測體驗。一位網友表示:

Grok4.1 上線以后,用了幾個用例,發現真的好用,現在除了編程之外的場景已經都用 Grok 了。

情感更充沛了,寫作我覺得是幾個模型里面寫的完全不像AI的了。至少那些全是emoji文章AI的。而且changlog中還說了針對信息求取類問題,幻覺率顯著降低(在真實生產和FActScore上的流程圖明顯改進)。

圖片圖片

還有網友已經開始用Grok 4.1寫MBTI小說,給出的評價是:“Grok 4.1真的非常瘋狂。”

圖片圖片

圖片圖片

還有網友試用了 Grok 4.1 的 Imagine 圖像生成功能,效果看起來很不錯。

圖片圖片

圖像圖像

總的來說,小編覺得Grok 4.1的這波升級有點類似于GPT 5.1的升級,也是更會聊天、更有人情味,寫作能力更強。這也能看出一個趨勢:大模型升級都開始拼情商了。

在幾個月之前,Grok 4 demo發布時,馬斯克曾在采訪中表示:

“我們現在其實已經快沒有什么真正能用來考 AI 的測試題了。哪怕是那些荒謬到極難、甚至人類幾乎不可能答出來、但被寫成標準題目的問題——AI 也在快速把它們變成小兒科。

所以我認為,對 AI 來說,終極的推理測試就是現實世界。比如你發明一項新技術,改進汽車或火箭的設計,或者研發一種新藥。

那關鍵在于:它真的能運行嗎?火箭能不能飛到目的地?車能不能開?藥有沒有療效?

無論是什么,現實會給出最終答案。

所以最終會形成一個圍繞現實世界的強化學習閉環。”

圖片圖片

而隨著Grok 4.1的發布,xAI為“會話智能、情感理解和現實世界的幫助”設定了新標準。

現在,GPT 5.1和Grok 4.1都來了,全世界都在等Gemini 3了。

參考鏈接:https://x.ai/news/grok-4-1#silent-rollout-november-114-2025

責任編輯:武曉燕 來源: 51CTO技術棧
相關推薦

2025-09-16 09:02:00

AI馬斯克模型

2025-09-26 08:03:41

2025-09-19 09:10:00

2022-01-23 10:53:47

星鏈互聯網衛星

2025-09-19 12:31:45

2023-12-13 08:46:33

人工智能ChatGPT機器人

2023-03-03 21:25:28

馬斯克特斯拉

2022-04-15 10:55:59

Web3反壟斷元宇宙

2022-05-23 15:57:18

加密貨幣黑客網絡攻擊

2021-06-11 17:14:26

黑客馬斯克加密貨幣

2025-02-11 11:46:48

OpenAI奧特曼馬斯克

2024-07-22 07:00:00

微軟藍屏網絡威脅Windows

2022-12-30 13:51:08

2025-10-23 16:38:30

2024-03-18 14:17:06

大模型開源人工智能

2023-04-18 15:03:24

模型數據

2024-01-16 12:43:00

機器人AI

2021-12-09 10:18:29

芯片半導體技術

2023-04-20 17:51:41

馬斯克微軟

2020-08-31 12:01:43

網絡攻擊惡意軟件網絡安全
點贊
收藏

51CTO技術棧公眾號

福利一区三区| 国产区av在线| 99亚洲精品| 亚洲欧美日韩在线一区| 国产精品视频分类| caoporn免费在线视频| 99r国产精品| 国产剧情久久久久久| 久一视频在线观看| 成人短片线上看| 精品少妇一区二区三区 | 97视频在线观看网站| 国产精品456| 国产精品草莓在线免费观看| 激情综合网五月天| 青青草91久久久久久久久| 精品国产sm最大网站免费看| 中文字幕22页| 欧美xo影院| 亚洲成人你懂的| 在线综合视频网站| 免费福利在线视频| a亚洲天堂av| 91久久精品美女| 国产无套丰满白嫩对白| 欧美精品导航| 国产亚洲欧洲高清| 网站免费在线观看| 欧美高清hd| 欧美精品一二三区| 少妇激情一区二区三区| 日本不卡1234视频| 亚洲国产精品欧美一二99| 黄色www在线观看| eeuss影院www在线播放| 久久亚洲私人国产精品va媚药| 97久久精品午夜一区二区| 一道本无吗一区| 视频一区视频二区在线观看| 欧美一级大胆视频| 日韩大片免费在线观看| 激情综合在线| 久久99青青精品免费观看| 国产高清视频免费在线观看| 色综合天天爱| 在线看日韩欧美| 人人人妻人人澡人人爽欧美一区| 亚洲欧美tv| 亚洲精品天天看| 青青草视频成人| 日韩欧美影院| 亚洲裸体xxxx| 巨胸大乳www视频免费观看| 秋霞综合在线视频| 日韩精品久久久久久福利| 国产一级免费片| 国产欧美啪啪| 日韩精品在线观看一区| 国产福利短视频| 自拍视频一区| 尤物九九久久国产精品的分类| 欧美做受高潮6| 精品免费在线| 色偷偷噜噜噜亚洲男人的天堂| 9.1片黄在线观看| 日韩伦理视频| 美女国内精品自产拍在线播放| 中文字幕手机在线观看| 欧美日韩视频一区二区三区| 久久久久久一区二区三区| 日本系列第一页| 久久国产高清| 国产精品自产拍高潮在线观看| 又骚又黄的视频| 狠狠色狠狠色合久久伊人| 91超碰rencao97精品| 成人小说亚洲一区二区三区| eeuss鲁片一区二区三区在线观看| 久久精品二区| 99re在线视频| 亚洲精品久久嫩草网站秘色| 精品无码一区二区三区在线| 亚洲天堂一区二区| 91精品国产综合久久蜜臀 | 91网站在线播放| 欧美日韩国产综合视频在线| 又爽又大又黄a级毛片在线视频| 亚洲欧美日韩综合aⅴ视频| 日韩一级特黄毛片| 欧美大胆成人| 欧美一级日韩免费不卡| 天天躁日日躁狠狠躁av麻豆男男 | 麻豆视频在线观看| 国产一区导航| 国产综合香蕉五月婷在线| 亚洲产国偷v产偷v自拍涩爱| 久久综合成人精品亚洲另类欧美| 亚洲精品在线视频观看| 久久青青色综合| 欧美在线视频你懂得| 中文字幕在线播放一区二区| 少妇精品久久久一区二区三区| 综合网中文字幕| 亚欧洲精品在线视频| 免费的国产精品| 97人人澡人人爽| yiren22亚洲综合伊人22| 一区二区三区在线视频观看| 激情综合网俺也去| 一区中文字幕电影| 中文字幕亚洲字幕| 免费在线不卡视频| 中文在线а√在线8| 欧美成人直播| 欧美精品久久久久a| 亚洲高清视频免费观看| 成人一区二区视频| 亚洲精品乱码视频| 91福利在线免费| 欧美一区二区高清| 我不卡一区二区| 亚洲精品视频啊美女在线直播| 国产一区玩具在线观看| 欧美美乳在线| 午夜av电影一区| 一级黄色免费毛片| 欧美3p视频| 日产日韩在线亚洲欧美 | 777午夜精品视频在线播放| 免费在线观看成年人视频| 欧美天天在线| 亚洲伊人成综合成人网| 91电影在线播放| 日韩欧美精品免费在线| 免费看毛片的网站| 欧美视频一区| 亚洲自拍偷拍色图| 老司机免费在线视频| 欧美在线观看18| 男人天堂av电影| 国产精品五区| 久久一区二区精品| 老司机深夜福利在线观看| 精品粉嫩aⅴ一区二区三区四区| 成年人av电影| 国产成人一区在线| www.亚洲成人网| 视频免费一区二区| 欧美肥婆姓交大片| 国产 欧美 精品| 一区二区三区四区在线免费观看| 四虎1515hh.com| 欧美黄色免费| 国产精品视频免费观看| 91精品国产黑色瑜伽裤| 亚洲精品国产综合久久| 91视频免费网址| xnxx国产精品| 日本老熟妇毛茸茸| 欧美一区二区三区激情视频| 国产精品视频久久久| 婷婷激情在线| 欧美成人vps| 日韩精品无码一区二区| 91蜜桃在线免费视频| 欧美 国产 小说 另类| 你微笑时很美电视剧整集高清不卡 | 国产精品探花一区二区在线观看| 国产欧美在线| 日韩成人av网站| 中文成人在线| 欧美人交a欧美精品| 天天干天天操av| 欧美影视一区在线| 极品美妇后花庭翘臀娇吟小说| 国产美女精品一区二区三区| 国产精品久久久久9999爆乳| 亚洲人成网www| 成人黄色在线播放| 黄色大片在线| 亚洲图片欧美午夜| 99国产成人精品| 精品久久久久人成| 天美传媒免费在线观看| 国产精品亚洲а∨天堂免在线| 热99这里只有精品| 欧美理论视频| 999国产在线| 卡通欧美亚洲| 欧美成人免费一级人片100| 亚洲av激情无码专区在线播放| 欧美在线观看一二区| 国产亚洲精久久久久久无码77777| 久久女同性恋中文字幕| 亚洲高清av一区二区三区| 国产亚洲亚洲| 亚洲一区 在线播放| 免费不卡中文字幕在线| 91青青草免费在线看| 欧美动物xxx| 欧美激情在线观看视频| 国产日本在线观看| 亚洲国产美女精品久久久久∴| 一区精品在线观看| 午夜欧美一区二区三区在线播放| 国产破处视频在线观看| 99免费精品在线| 亚洲精品国产久| 日韩精品91亚洲二区在线观看| 妺妺窝人体色www看人体| 成人午夜av| 精品久久蜜桃| 国产亚洲精aa在线看| 国产精品1234| 国产乱码精品一区二三赶尸艳谈| 日韩亚洲欧美中文高清在线| 青青草观看免费视频在线| 欧美大胆一级视频| 亚洲一区二区三区网站| 一本大道久久a久久综合| 国产亚洲成人av| 亚洲精品乱码久久久久久黑人| 黄色片网站在线播放| 久久精品一区蜜桃臀影院| 六十路息与子猛烈交尾| 成人免费观看视频| 欧美性受xxxx黒人xyx性爽| 麻豆高清免费国产一区| chinese少妇国语对白| 亚洲在线国产日韩欧美| 国产精品久久国产| 影视一区二区| 日本丰满大乳奶| 色欧美自拍视频| 五月天亚洲综合小说网| 亚洲动漫在线观看| 鲁鲁狠狠狠7777一区二区| 欧美天堂社区| 久久99精品国产一区二区三区| 风间由美性色一区二区三区四区 | 一区二区久久精品66国产精品| 一本色道久久综合亚洲91| 国产又粗又爽视频| 欧美日韩视频在线| 天天综合网久久综合网| 亚洲成人激情自拍| 国产亚洲欧美精品久久久www| 亚洲精品成人天堂一二三| 农村妇女精品一区二区| 亚洲欧美偷拍三级| 国产免费无码一区二区视频| 亚洲激情图片qvod| 久草免费在线视频观看| 亚洲国产日韩在线一区模特 | 欧美视频在线观看免费网址| 亚洲欧美在线观看视频| 欧美日韩中文在线| 国产免费一区二区三区四区五区| 91久久奴性调教| 中文字幕免费在线看| 欧美日韩午夜在线| 国产精品久久777777换脸| 日韩一区二区在线看| 亚洲成a人片77777精品| 精品亚洲一区二区三区在线观看 | 成人性免费视频| 亚洲一区免费| 欧美日韩亚洲自拍| 国产真实精品久久二三区| 男人女人拔萝卜视频| 成人av片在线观看| 级毛片内射视频| 成人欧美一区二区三区小说| 精品在线免费观看视频| 日韩欧美国产中文字幕| 亚洲字幕av一区二区三区四区| 日韩亚洲欧美成人一区| 午夜视频在线免费播放| 在线看福利67194| 蜜桃传媒在线观看免费进入| 91精品国产高清自在线看超| 草民电影神马电影一区二区| 97碰碰视频| 国产成人ay| 美女黄色片网站| 亚洲一区欧美二区| 99九九精品视频| 91网址在线看| 欧洲第一无人区观看| 欧美丝袜一区二区| 国产精品无码久久av| 亚洲精品国精品久久99热一| 日本电影在线观看网站| 久久免费视频网| 粉嫩av一区二区三区四区五区| 99r国产精品视频| 中日韩免视频上线全都免费| 日韩一级片一区二区| 玖玖国产精品视频| 欧美激情一区二区三区p站| 欧美国产禁国产网站cc| 久久久国产精品成人免费| 91精品国产综合久久久久 | 久久精品国产精品| 成人性生交大片免费网站| 亚洲综合一区二区不卡| 久久99性xxx老妇胖精品| 99久久免费观看| 久久99精品国产麻豆不卡| 给我看免费高清在线观看| 亚洲男女一区二区三区| 亚洲 国产 日韩 欧美| 亚洲第一在线视频| 国产日产一区二区| 国产精品视频自在线| 欧美三级自拍| 每日在线观看av| 国产主播一区二区三区| 99久久99久久精品免费看小说. | 久久久久久99精品| 国产无码精品在线播放| 日韩一区二区在线观看视频播放| 成年午夜在线| 日本a级片电影一区二区| 亚洲午夜免费| 超碰在线免费观看97| 蜜臀av在线播放一区二区三区| 91精品人妻一区二区| 精品日韩美女的视频高清| 国产精品探花视频| 日韩一区二区在线视频| 久久青草免费| 色姑娘综合av| 日韩精品高清不卡| 女人又爽又黄免费女仆| 日韩欧美黄色动漫| 欧洲亚洲在线| 奇米4444一区二区三区| 日韩动漫一区| 国产免费观看高清视频| 成人午夜电影久久影院| 国产在线视频99| 精品国产乱码久久久久久图片| 麻豆福利在线观看| 不卡视频一区二区| 国产精品多人| 国产69视频在线观看| 亚洲成a人v欧美综合天堂| 亚洲精品一区二区口爆| 欧美精品videofree1080p| 亚洲精品一二三**| 91精品国产91久久久久麻豆 主演| 国产99久久久国产精品潘金网站| 欧美成人三级在线观看| 日韩精品一区二区三区中文不卡 | 亚洲一级二级在线| 精品人妻无码一区二区| 欧美第一淫aaasss性| 免费福利视频一区| 亚洲乱码中文字幕久久孕妇黑人| 久久一区二区三区国产精品| 少妇又紧又色又爽又刺激视频| 中文字幕欧美日韩精品| 精品中文视频| 三上悠亚久久精品| 久久久久国产成人精品亚洲午夜| 少妇高潮av久久久久久| 色999日韩欧美国产| 国产精品毛片aⅴ一区二区三区| 久久这里只有精品18| 99久久久精品免费观看国产蜜| 黄色av一级片| 日韩少妇与小伙激情| 97久久综合区小说区图片区| 青青草精品视频在线| 亚洲国产精品二十页| 国产精品一区二区人人爽| 国内精品久久影院| 欧美午夜精彩| 亚洲av综合色区无码另类小说| 狠狠色狠狠色综合日日五| 岛国最新视频免费在线观看| 91九色蝌蚪国产| 国产日韩欧美| 精品视频第一页| 精品少妇一区二区三区免费观看| 国产精品av一区二区三区 | 99国产在线观看| 美女精品在线| 在线免费观看亚洲视频| 亚洲免费人成在线视频观看| 国产精品欧美一区二区三区不卡| 国产伦精品一区二区三区四区视频_| 日本一区二区在线不卡| 亚洲国产精品18久久久久久| 国产精品jizz在线观看麻豆| 黑人一区二区| 少妇愉情理伦三级| 亚洲精品成人免费| 91麻豆精品一二三区在线|