精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

GPT-4o成為全領域SOTA!基準測試遠超Gemini和Claude,多模態功能遠超GPT-4

人工智能 新聞
OpenAI半小時的發布會讓很多人第一反應是直呼「失望」,但隨著官網放出更多demo以及更多網友開始試用,大家才發現GPT-4o真的不可小覷,不僅在各種基準測試中穩拿第一,而且有很多發布會從未提及的驚艷功能。

OpenAI在發布會上官宣GPT-4o之后,各路大神也開始了對這個新模型的測評,結果就是,GPT-4o在多項基準測試上都展現了SOTA的實力。

別家發布會都在畫餅,OpanAI卻總能開出一種「欲揚先抑」的效果,驚喜全在發布會之后。

 基準測試結果

首先,在LMSys聊天機器人競技場上的ELO分數排行上,GPT-4o套了一個GPT2聊天機器人的馬甲,以一騎絕塵的態勢名列第一,評分為1310,和第二名GPT-4-turbo的1253分相比,呈現斷檔式的提升。

再來看多模態領域的基準Reka Vibe-Eval,這也是一個很有挑戰性的測試,由 269 個超高質量圖像文本對組成,用于評估多模態語言模型的性能。

在Reka Vibe-Eval 分數的排行榜上,GPT-4o再次榮登第一,相比谷歌新發布的Gemini Pro 1.5高出了將近三個百分點。

圖片

而且GPT-4o克服了這個測試集上大模型常見的「逆縮放」問題,也就是在某些案例中表現不如小模型的問題。

圖片

圖片

不止如此,GPT-4o的內存突破也值得關注。

針里尋針(Needle in a Needlestack,NIAN)是最近非常流行的開源基準測試,用于評估大模型關注上下文內容的能力。

大語言模型的進展導致曾經流行的基準測試「大海撈針」已經過時,在此基礎上,更具挑戰性的「針里尋針」測試誕生了。

圖片https://github.com/llmonpy/needle-in-a-needlestack

測試中,「針里尋針」會從一個大型打油詩數據庫中挑出幾首,將其放在prompt中的特定位置,之后再詢問關于這些打油詩的問題,由此可以很好地考察LLM的上下文記憶能力。

每個測試使用5-10個打油詩,放置在prompt中的5-10個位置,重復2-10次。

曾經,GPT-4 Turbo和Claude-3 Sonnet都在「針里尋針」測試中表現得非常慘烈,側面證明了這個任務對LLM的難度和挑戰性。

圖片

廣受歡迎的Mistral模型雖然表現得稍好一點,但正確率基本不超過60%。

圖片

相比之前的模型,GPT-4o取得了飛躍性的突破,正確率每個token位置上都不低于80%,一度接近100%,表現近乎完美!

圖片

GPT-4o的能力被嚴重低估了

圖片

新推出的輕量級「GPT-4o」模型,雖然有速率限制,但重點是——免費!

語音交互絕對是模型的「亮點」,但它的功能遠不止于此!

OpenAI表示這是他們第一個真正的多模態模型,通過單一的神經網絡完成所有任務。

網友表示「不知道這是否是真的還是有些夸大,但GPT-4o在所有領域的能力都超過了市場上的其他任何產品?!?/span>

有網友發現,作為原生多模態模型,GPT-4o的文生圖效果非常驚艷,甚至超過DALLE和MidJourney

圖片

而且,在生成圖片上的文字時,效果更是遠遠好過DALL-E 3。

DALL-E 3 在圖像上生成超過5個單詞后就會崩潰,而GPT-4o不僅做到文字的連續性,還能在之前生成圖像的基礎上進行迭代。

這種迭代是非常重要的,也標志著模型能力的巨大飛躍。雖然生成出來的文字還是非常「生硬」,甚至有明顯錯誤,但是迭代能力可以使GPT-4o后續逐漸減少文字和圖像方面的錯誤。

圖片

圖片

除了生成文字,GPT-4o還能你為生成獨立的角色形象,然后進行對話互動。

神奇的是,他們把對話界面隱藏在一個懸停圖標下!這意味著你可以對它進行任意動作、風格和場景的設計!而且GPT-4o在風格表現方面做得非常出色。

平面圖片不夠炫酷?GPT-4o能夠對圖片進行3D重建。

GPT-4o還是一個強大的PS工具,OpenAI的logo被輕松嵌入到了杯墊上,但仔細看的話,你會注意到這兩張圖片不是同一個杯墊。

模型沒有在原圖片基礎上進行修補,而是從頭生成,因此看起來像原始的、未經過PS的圖片。

Reddit上一位網友分析認為,OpenAI的Sam Altman等主創團隊可能是太喜歡《Her》這部電影了,他們對GPT-4o的語音互動設計很明顯受電影的啟發(Altman也暗示了這一點),而且發布會的展示也借鑒了電影的手法——

讓模型自己展示其驚人的能力,而不是像蘋果或者谷歌那樣列出原始數據和技術細節。

這樣做非常有「藝術感」,吊足了圍觀群眾好奇心,但也很容易讓人低估模型的能力。

GPT-4o的能力如此強大,也引發了對模型架構的猜測和熱烈討論,網友們的觀點也呈現出兩個方向。

一派認為,模型架構應該基本與GPT-4類似。

而另一方的觀點似乎更占上風,認為底層架構絕對有重大變動,目標是對齊GPT-4的文字能力,并在推理和多模態方面相比GPT-4有更多提升。

圖片

白熱化的開源與閉源之爭

雖然搭載GPT-4o的ChatGPT聊天界面及其API已經免費開放給用戶使用,但OpenAI依舊堅持了不開源的傳統,這次甚至連一篇技術報告都沒有。

但這并不影響GPT-4o在LLM角斗場中掀起風云。Liquid AI的資深科學家Maxime Labonne這樣描述:「LLM 爭奪戰愈演愈烈,GPT-4o 遙遙領先」

圖片

這場競爭中值得關注的另一個角度,則是大語言模型的開源和閉源之戰。GPT-4o能力的快速增長導致閉源和開源之間的差距再次被拉大。

更重要的是,閉源陣容中并非GPT-4o一枝獨秀。綜合迄今為止發布的所有LLM,閉源模型的總體表現始終比開源模型更加優秀,而且GPT、Claude、Gemini等系列的閉源模型始終走在最前沿。

紅色代表閉源模型,綠色代表開源模型,藍色區域表示二者之間的差距

曾經,大公司將Linux、安卓等項目開源的動力是希望借助所有開發者的力量,得到不同角度的反饋和更新意見,從而進行快速的迭代優化,并且構建了在世界范圍內有廣泛影響力的大規模社區,反哺其他的產品線。

但對于LLM來說,情況就不一樣了。

想要不斷提升大語言模型的能力,算力成本是更大的挑戰。根據斯坦福大學發布的2024年人工智能指數報告,訓練GPT-4的計算成本約為7800萬美元,Gemini Ultra則是一億九千一百萬美元左右。

圖片

原文鏈接:https://aiindex.stanford.edu/wp-content/uploads/2024/04/HAI_AI-Index-Report-2024.pdf

面對這種級別的投入,去中心化的開源社區對比有巨額投資的科技公司,顯然沒有優勢。企業要想擴大模型產品的影響力,只需像OpenAI一樣,免費開放API給用戶使用即可。

目前這種開源和閉源模型差距越來越大的趨勢,Jim Fan曾在去年6月就做出過類似的預測。

圖片

但是,LLM的開閉源之爭,不僅是企業的商業決策,更關乎AI行業整體的發展。

首先是安全性問題。最近剛從OpenAI離職的首席科學家Ilya Sutskever本人就對此十分關注,他曾在2016的一封電郵中寫道:「隨著我們越來越接近構建人工智能,開始變的不那么開放是有意義的?!?/span>

可以想象一下,如果像GPT-4o這樣能力強大的模型公布了代碼和模型權重,任何開發者都可以在此基礎上微調,以滿足自己定義的任何功能,AI的力量可能會迅速失控。

圖片

「像 GPT 這樣的研究如果落入壞人之手,也可能會進化并導致災難。」

但另一方面,這些只開放API但不開源的大語言模型對初創公司并不友好。他們沒辦法根據特定的需求和場景、使用私有數據對模型進行微調,開發出有獨創性的、功能靈活多樣的產品,只能開始「套殼」。

導致的結果就是,AI初創公司并沒有像我們想象的那樣蓬勃發展,我們也沒有看到更多的加入到工作和生活各方各面的AI產品。

正像Jim Fan推文中提到的,「開源LLM總是有更大的多樣性」。

這似乎是一個兩難問題。

隨著大模型之戰愈演愈烈,相信對于開源和閉源的激烈討論依舊會持續下去。

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-06-28 18:13:05

2024-05-21 12:23:17

2025-04-08 02:26:00

2024-12-18 13:24:30

谷歌AI大語言模型

2024-10-06 09:00:00

AI訓練數據

2025-05-14 09:15:00

2024-06-27 12:45:30

2024-06-21 09:51:17

2025-01-06 13:15:02

2023-06-19 08:19:50

2024-08-08 13:04:28

2024-03-28 14:26:51

人工智能

2024-05-08 07:28:06

LLMLinguaLLM大型語言模型

2024-06-05 08:29:35

2025-04-16 09:35:03

2025-02-18 12:30:00

2024-06-17 18:06:17

2024-07-16 13:24:38

2025-06-04 09:05:18

2025-01-02 11:01:45

點贊
收藏

51CTO技術棧公眾號

精品国产伦一区二区三区| 成人无码www在线看免费| 高清免费电影在线观看| 国产精品一区在线观看你懂的| 久久99国产综合精品女同| 亚洲欧美综合视频| 欧美123区| 尤物在线观看一区| 欧美一区二区高清在线观看| 91片黄在线观看喷潮| 亚洲黄色精品| 日韩在线中文视频| 国产xxxx视频| 日韩福利影视| 一本大道av伊人久久综合| 性做爰过程免费播放| 黄色影院在线播放| 丰满少妇久久久久久久| 国产精品久久久久久久久男| 日韩aaaaaa| 欧美成人一区二免费视频软件| 亚洲精品中文字幕av| 中文字幕乱码在线人视频| 韩国美女久久| 午夜精彩视频在线观看不卡| 国产盗摄视频在线观看| 成人欧美一区| 91农村精品一区二区在线| 不卡视频一区二区三区| 在线视频播放大全| 新狼窝色av性久久久久久| 欧美国产日韩一区| 黑人操日本美女| 日本a级不卡| 亚洲福利视频久久| 337p日本欧洲亚洲大胆张筱雨 | 不卡的一区二区| 国产极品一区| 欧美亚洲日本一区| 夫妻免费无码v看片| sm捆绑调教国产免费网站在线观看 | 亚洲一区免费| 久久久亚洲影院| 久久久香蕉视频| 欧美三级视频| 久久久久久久久久久久av| 国产一区二区播放| 这里只有精品在线| 九色精品免费永久在线| 玖玖爱这里只有精品| 羞羞答答成人影院www| 日韩亚洲欧美中文在线| 国产免费嫩草影院| 久久久久久久久丰满| 日韩视频在线免费观看| 激情五月激情综合| 午夜国产精品视频免费体验区| 久久久精品国产| 国产波霸爆乳一区二区| 一区二区中文字| 欧美大片大片在线播放| 国产一级在线观看视频| 一本一本久久| 国产成人精品最新| 中文字幕在线观看视频一区| 久久精品国产亚洲a| 成人黄色中文字幕| www.久久久久久久久久| 91丝袜国产在线播放| 欧美色欧美亚洲另类七区| 超碰在线国产| 亚洲日本电影在线| 欧美人成在线观看| 成人激情综合| 7777精品伊人久久久大香线蕉超级流畅 | 精品三级在线观看| 国产精品九九视频| 国产精品一区高清| 精品国模在线视频| 精品亚洲永久免费| 视频一区国产视频| 成人a免费视频| 色丁香婷婷综合久久| 久久久久一区二区三区四区| 国产高清免费在线| 国产免费拔擦拔擦8x在线播放| 日本道免费精品一区二区三区| 国产亚洲视频一区| 国产毛片久久久| 最近2019中文免费高清视频观看www99 | 天堂av在线免费观看| 国产日韩精品久久久| 影音先锋成人资源网站| 成人美女大片| 日韩精品一区在线| www久久久久久久| 欧美1级日本1级| 日韩av成人在线| 国产sm主人调教女m视频| 972aa.com艺术欧美| 中文字幕久久综合| 中文字幕在线中文字幕在线中三区| 欧美三级三级三级爽爽爽| 中文字幕第九页| 97欧美在线视频| 国产成人精品久久二区二区| 成人av无码一区二区三区| 久久精品这里都是精品| 99久久免费观看| 亚洲成a人片777777久久| 亚洲精品美女视频| 我家有个日本女人| 麻豆国产精品777777在线| 久久久久久久免费| 欧美极品少妇videossex| 欧美日韩视频专区在线播放| yy1111111| 欧美日韩亚洲一区| 国产精品久久久久影院日本| 亚洲色偷精品一区二区三区| 亚洲免费高清视频在线| 精品在线观看一区二区| 免费在线视频欧美| 在线欧美一区二区| 亚洲蜜桃精久久久久久久久久久久| 欧美国产免费| 91免费欧美精品| 日本高清在线观看wwwww色| 欧美丝袜第一区| xxxx黄色片| 亚洲美女毛片| 国产精品亚洲不卡a| 日本在线观看大片免费视频| 51精品视频一区二区三区| 日本污视频网站| 免费在线观看成人| 成人网页在线免费观看| av在线首页| 在线这里只有精品| 亚洲v国产v欧美v久久久久久| 亚洲人人精品| 黑人巨大精品欧美一区二区小视频 | 在线观看成人动漫| 精品福利电影| 国产不卡一区二区在线观看| 欧美野外wwwxxx| 日韩亚洲欧美在线| 青娱乐免费在线视频| 高清在线不卡av| 男人添女荫道口女人有什么感觉| 欧美成人毛片| 久久久久www| 精品人妻av一区二区三区| 亚洲男女一区二区三区| 免费看91视频| 99国产成+人+综合+亚洲欧美| 国产一区二区无遮挡| 九色视频在线观看免费播放| 欧美日韩亚洲精品内裤| 亚洲AV无码片久久精品| 日韩av电影天堂| 亚洲区一区二区三区| 国产精品66| 欧美成人免费全部观看天天性色| 国产成人麻豆精品午夜在线| 亚洲在线一区二区三区| 黄色片视频免费观看| 免费在线亚洲欧美| 亚洲成人一区二区三区| 成人在线精品| 久久久亚洲欧洲日产国码aⅴ| 日韩电影网址| 欧美日韩精品一二三区| 福利所第一导航| 久久综合国产精品| 性欧美1819| 国内精品久久久久久久影视蜜臀| 精品综合在线| 久久精品超碰| 久久久久久av| 国产美女性感在线观看懂色av| 69久久夜色精品国产69蝌蚪网| 久久一二三四区| 久久久www成人免费毛片麻豆| 在线观看免费不卡av| 黄色欧美日韩| 日韩高清国产一区在线观看| 日韩精品一区二区三区免费视频| 欧美有码在线观看视频| 国产成人午夜| 亚洲人成电影网| 亚洲av无码国产精品久久不卡| 色综合天天做天天爱| 亚洲色图综合区| 国产日韩精品一区二区三区| 亚洲精品无码一区二区| 美女视频一区在线观看| 欧美亚洲日本一区二区三区| 久久成人综合| 久久精品日产第一区二区三区乱码 | 亚洲国产精品一区二区第四页av| 精品视频在线观看免费观看| 日韩av快播网址| 国内在线视频| 日韩日本欧美亚洲| 亚洲人午夜射精精品日韩| 日韩视频在线观看一区二区| 人妻中文字幕一区二区三区| 亚洲成国产人片在线观看| 成年人免费视频播放| 91欧美一区二区| 在线中文字日产幕| 精品一区二区三区免费视频| 波多野结衣家庭教师视频| 欧美激情第8页| 正在播放亚洲| 欧美在线免费看视频| 精品综合久久| 久久夜色精品国产噜噜av小说| 91精品国产综合久久香蕉| 偷拍精品精品一区二区三区| 久久久久久久爱| 伊人手机在线| 久久精品国产亚洲精品| 草碰在线视频| 亚洲人成网7777777国产| 天堂a中文在线| 日韩精品久久久久 | 影音先锋日韩有码| 久草福利在线视频| 亚洲精品一区av在线播放| 色综合久久久久久| 精品国产乱码久久久久久牛牛| 国产麻豆免费视频| 欧美高清精品3d| 136福利视频导航| 欧美日韩国产首页在线观看| 性色av一区二区三区四区| 在线视频欧美区| 免费黄色小视频在线观看| 色婷婷精品大视频在线蜜桃视频| 国产 日韩 欧美 在线| 香蕉成人伊视频在线观看| 久久精品国产亚洲AV无码麻豆| 有坂深雪av一区二区精品| 欧美人妻一区二区| 亚洲一区二区不卡免费| 日韩欧美亚洲国产| 狠狠躁夜夜躁人人爽超碰91| 日本三级小视频| 一本大道av伊人久久综合| 人人妻人人爽人人澡人人精品| 欧洲精品中文字幕| 一级特黄aaa| 欧美一级片免费看| 国产香蕉在线观看| 日韩成人在线视频| 久草视频视频在线播放| 日韩在线国产精品| www在线免费观看视频| 欧美精品久久久久a| 国产污视频在线播放| 欧美中文字幕视频| 成人国产激情| 97se视频在线观看| 久久亚洲道色| 亚洲午夜精品一区二区三区| 一区二区在线| 国产在线青青草| 麻豆精品一二三| 伊人久久一区二区三区| 国产亚洲欧美一区在线观看| 国产午夜精品理论片| 亚洲一区二区在线免费看| 香蕉影院在线观看| 欧美高清dvd| 天天综合永久入口| 在线日韩日本国产亚洲| 色女人在线视频| 欧美在线一级va免费观看| 日韩欧国产精品一区综合无码| 99久久精品久久久久久ai换脸| 欧美综合精品| 综合色婷婷一区二区亚洲欧美国产| 国内自拍一区| 99999精品视频| 国产精品一二三四区| 人妻av一区二区| 综合婷婷亚洲小说| 在线观看日韩中文字幕| 91麻豆精品国产91久久久久久久久| 日本人妻丰满熟妇久久久久久| 在线色欧美三级视频| freexxx性亚洲精品| 国产日韩精品在线播放| 精品少妇3p| 一二三在线视频| 日韩成人午夜电影| 少妇激情一区二区三区视频| 国产精品第五页| 9i看片成人免费看片| 日韩一区二区三区四区| 91福利在线视频| 欧美一级成年大片在线观看| 欧美午夜在线播放| 日韩av影视| 亚洲激情网站| 精品人妻一区二区三| 欧美激情在线看| 午夜毛片在线观看| 欧美mv日韩mv国产网站app| 日本韩国在线视频爽| 国产成人久久久精品一区| 理论片一区二区在线| 精品免费久久久久久久| 欧美a级一区二区| xxx在线播放| 欧美日韩亚洲系列| 人妻偷人精品一区二区三区| 欧美xxxx做受欧美| 伊人久久一区| 亚洲人成77777| 蜜臀av国产精品久久久久| 国产精品扒开腿做爽爽| 午夜精品国产更新| 人成网站在线观看| 欧美大成色www永久网站婷| 91成人在线网站| 一本久道久久综合狠狠爱亚洲精品| 久久精品午夜| 一级性生活大片| 欧美午夜激情在线| 婷婷国产在线| 69av在线视频| 台湾佬综合网| 黄www在线观看| 91麻豆国产在线观看| 免费看日韩毛片| 亚洲精品福利在线| 亚洲性色av| 欧美第一黄网| 日韩av一二三| 丁香六月激情综合| 欧美理论电影在线| 国产cdts系列另类在线观看| 亚洲一区二区三区毛片 | 欧美夫妻性视频| 亚洲国产高清在线观看| www.男人天堂网| 成人性生交大合| 国产情侣在线视频| 日韩精品小视频| 日韩精品三区| 亚洲午夜精品一区二区 | 国产成人无码一区二区在线观看 | 在线视频免费观看一区| 最新中文字幕亚洲| 自拍偷拍亚洲| 欧美中文字幕在线观看视频| 成人高清视频免费观看| 波多野结衣国产| 国产一区二区三区在线视频| 四虎国产精品免费久久| 成人污网站在线观看| 成人激情动漫在线观看| 男人天堂2024| 精品国产依人香蕉在线精品| japanese色系久久精品| 成人一级片网站| 亚洲欧洲精品一区二区三区| 午夜久久久久久噜噜噜噜| 5566日本婷婷色中文字幕97| 精品国产91| 亚洲AV无码久久精品国产一区| 午夜精品视频在线观看| 2019中文字幕在线视频| 99久久精品免费看国产一区二区三区 | 国产极品模特精品一二| 免费日韩中文字幕| 亚洲丝袜制服诱惑| 无码精品在线观看| 国产欧美婷婷中文| 91久久亚洲| 天天爽天天爽天天爽| 亚洲国产成人精品久久| 久草综合在线| 免费毛片网站在线观看| 国产精品色噜噜| 天天操天天操天天| 国产情人节一区| 国产精品久久777777毛茸茸| 情侣偷拍对白清晰饥渴难耐| 亚洲国产中文字幕在线观看| 欧美美女被草| 黑人糟蹋人妻hd中文字幕| 亚洲丝袜制服诱惑| 国产一区二区三区不卡在线| 国产91亚洲精品一区二区三区| 日韩精品一级中文字幕精品视频免费观看| 草视频在线观看|