精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

力壓70B Llama 3,Gemma 2成最強開源模型!大佬質疑用榜單prompt微調引全網熱議

人工智能 開源 新聞
時隔4個月上新的Gemma 2模型在LMSYS Chatbot Arena的排行上,以27B的參數擊敗了許多更大規模的模型,甚至超過了70B的Llama-3-Instruct,成為開源模型的性能第一!

谷歌出手,果然非同凡響。

圖片

Gemma 2上周剛剛發布,就在LMSYS競技場上取得了亮眼的成績。

在整體評分上Gemma 2拿到了開源模型最高分,而且用27B的參數「以小搏大」,超過了Llama 3-70B-Instruct、Claude 3 Sonnet等更大量級的知名模型。

開源模型的頭把交椅真的要易主Gemma了?

圖片

對于這個成績,谷歌研究院首席科學家Jeff Dean也發文慶祝。

圖片

很高興看到新版Gemma-2-27B模型成為LMSYS上最好的開源模型(擊敗了一些相當大的模型)。

我們認為,27B對于很多場景來說確實是一個非常好的規模,而Gemma-2-27B也是一個非常好的模型!

不僅是總體評分,在LMSYS昨天剛發布的「多輪對話」排行榜上,Gemma 2的表現依舊強勁。

LMSYS表示,LLM的多輪對話在當今許多應用場景中非常重要。

在競技場的投票中,多輪對話的占比為14%,占到了不可忽視的比例。

圖片

因此他們推出了新的排行類別「多輪對話」,其中包括兩輪或多輪的測試,以衡量模型在更長時間內交互的能力。

圖片

在這個全新的排行榜中,Claude家族的排名顯著提升。

總分屈居亞軍的Claude 3.5 Sonnet,成功地與GPT-4o并列第一;Claude 3 Opus也從原來的第8名躍居第三。

我們本次的主角Gemma 2也實現了2個名次的進步,進入前十行列,而且壓了Llama 3-70B-Instruct一頭。

圖片

在Gemma 2放出9B和27B兩個版本的同時,DeepMind研究員Clement在推特上透露,接下來還會有2B版本和大家見面!

圖片

曾經只靠開源「一招鮮」的Meta終于迎來了強勁對手。Gemma 2和Llama 3的競爭想必會在未來一段時間內持續下去。

Gemma為什么這么強?

為什么27B的Gemma 2能打敗70B的Llama 3?谷歌究竟用了什么技術實現如此高的參數效率?

或許我們可以從官方發布的技術報告中找到蛛絲馬跡。

圖片

報告地址:https://developers.googleblog.com/en/fine-tuning-gemma-2-with-keras-hugging-face-update/

訓練數據方面,可想而知,并沒有具體的數據來源和組成,只有數據量。

由于Gemma既沒有多模態又不針對多語言任務,因此訓練語料只包含各種類型的文本和代碼,且主要語言為英語。

27B模型的訓練數據有13萬億token,9B模型和2.6B模型則分別為8萬億、2萬億token。

圖片

架構上,Gemma 2從Gemini團隊和Gemma 1沿用了很多方面,包括旋轉位置編碼(RoPE)、SentencePiece分詞器、Logit軟上限、GeGLU激活函數等等。

相比Gemma 1,Gemma 2采用了更深的網絡,且在某些部分做了更新——

局部滑動窗口和全局注意力

Gemma 2交替使用局部滑動窗口和全局注意力,滑動窗口大小設置為4096 token,而全局注意力層的設置為8192 token。

這種方法在正確捕捉文本細節的同時,又能保持對上下文和全局的正確理解。

知識蒸餾

能夠訓練出有競爭力性能的9B和27B模型,成功的知識蒸餾過程估計是最為重要的環節。

傳統訓練大語言模型的方法主要是根據之前的token,預測下一個token,需要大量的數據進行訓練。

但是,人類的學習過程并不依賴走量的知識輸入。比如,一位學生由于閱讀原著的需要學習一門外語,他并不需要看遍所有的書籍,只需要以一本書為綱,通過理解后融會貫通。

而知識蒸餾法與人的學習過程更加類似。一個小模型向另一個已經進行過預訓練的大模型學習,通過這種方式助產小模型對于token的預測。

站在老師模型的肩膀上,學生模型能用較少的訓練數據、更少的參數量提升性能。

圖片

用LMSYS數據微調,引AI2研究員質疑

開源模型界終于在Llama之后迎來了Gemma 2這個最新的扛把子選手,就在大家忙著興奮的同時,Allen AI的研究員Nathan Lambert冷靜地在技術報告中發現了華點:

微調數據的來源包括LMSYS的聊天數據集!

似乎是預想到了可能的質疑,論文中特意強調只使用了prompt,把答案剔出去了。

圖片

Lambert依舊不認可這種行為。他發了一篇推特,疑惑的語氣中帶著一絲嘲諷:為了在競技場上刷分數,你們谷歌團隊挺有想象力的。

圖片

這位Nathan Lambert其實算是LLM領域比較資深的專業人士,他博士畢業于UC伯克利大學,在DeepMind和FAIR都有實習經歷。

圖片

針對Lambert的質疑,LMSYS隨后回復了一篇意義不明的超長推特,似乎透露出了為谷歌辯護的隱晦立場。

圖片

推特全文如下:

從一開始,Chatbot Arena的使命就是通過人類偏好來解決LLM的評估問題。

通過開放我們的數據集和論文,我們希望社區能研究真實世界的prompt,并利用這些數據改進模型(就像ImageNet的訓練集一樣)。

我們相信,通過實時和新鮮的用戶投票,Arena比靜態基準測試如MMLU更不容易過擬合。

現在,有些人可能對以下兩個方面存在質疑——(1)prompt重復的程度和( 2)數據分布。這正是我們開放數據和論文研究的原因。

我們的Llama-3博客文章顯示,經過去重之后,大約10%的重復對結果的影響很小。此外,論文還包括對prompt分布的主題建模,展現了跨語言的多樣化使用案例。

展望未來,我們計劃深入了解數據的新鮮度和分布。也歡迎大家用新任務來挑戰模型,研究我們的100萬prompt和偏好數據,或者加入我們的Kaggle挑戰。

這有些讓人摸不著頭腦,既說「用數據改進模型是受歡迎的」,又說「我們開放數據和論文是為了回應質疑」。

發帖的Lambert也同樣被搞糊涂了,他進一步闡明了自己的立場。

「感覺我們討論的不是同一件事,我的觀點依舊成立。很可能有更多的人也在這樣做,但我們并不知道。」

圖片

LMSYS最新回復的內容更加讓人內心復雜——

「對不起,雖然我貼上了你的推特,但不是在特意回復你。」

圖片

對于微調應不應該使用LMSYS數據這個問題,評論區的網友也吵得熱火朝天。

有些人覺得Lambert的質疑毫無道理。畢竟LMSYS公開了數據集,用來做微調有什么不可以的?而且只使用了prompt,答案是教師模型生成的。

圖片

畢竟大家都在看LMSYS的聊天機器人Arena的分數,如果大家都不用這個數據才比較出乎意料。

圖片

這個立場得到了大部分人的認同。雖然谷歌是為數不多的坦誠,敢把用了LMSYS數據這件事寫進論文,但他們絕對不是第一個使用這些數據的人。

「我打賭GPT-4o和Llama 3也這么干了。」

圖片

畢竟在一段時間內,LMSYS競技場曾經是唯一可信的基準測試。

圖片

而這也正是Lambert所擔心的——LMSYS是業界為數不多的得到大多數人認可的基準測試,如果大家再用它的數據微調甚至訓練,豈不很快又會失去公信力?

更糟糕的情況是,不是每一個模型都像Gemma 2這樣會承認這件事。

不少觀點比較中肯的網友也點出了這一點。

「我相信這會降低Arena的信噪比。」

圖片

看來在基準測試領域,重復的歷史總在不斷上演,而那個金句也總是適用——

「當一個衡量標準成為目標時,它就不再是一個好的衡量標準了。」

圖片

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-02-22 10:09:00

開源模型

2024-09-09 09:20:00

2024-06-05 08:33:29

2024-04-23 07:00:00

2024-04-09 13:21:00

AI開源

2024-04-30 08:28:44

開源大模型Llama

2023-08-14 13:29:37

2024-08-16 14:00:00

2023-10-11 13:21:12

模型數據

2024-04-19 08:01:01

Llama 3 8BMeta

2024-01-31 09:38:23

AI模型

2024-05-30 12:50:05

2023-10-12 14:40:10

AI模型

2023-09-07 13:25:00

AI模型

2024-01-10 17:10:53

數據訓練

2024-12-18 07:10:00

2024-06-19 13:02:01

2013-01-18 14:00:59

VMware
點贊
收藏

51CTO技術棧公眾號

黄色a级片免费| 国产亚洲精品美女久久久m| 欧美人与性囗牲恔配| 日韩经典一区| 亚洲免费在线看| 国产精品一区而去| 亚洲中文一区二区| 亚洲经典一区| 亚洲精品按摩视频| 日本网站免费在线观看| 成人免费黄色网页| 国产一区高清在线| 国产91精品久久久久久| 日本精品在线观看视频| 亚洲电影一区| 91豆麻精品91久久久久久| 国产福利片一区二区| 高清乱码毛片入口| 麻豆精品一二三| 久久欧美在线电影| 亚洲视频重口味| 亚洲免费专区| 日韩一区二区在线看| 日本精品www| 怡红院在线播放| 国产三级精品在线| 国产伦精品一区二区三区免费视频 | 精品国产成人系列| 2025韩国理伦片在线观看| 爱情岛亚洲播放路线| 国产精品九色蝌蚪自拍| 你懂的视频在线一区二区| 99在线观看精品视频| 日韩精品亚洲一区二区三区免费| 久久久久久av| 国产网站一区二区| 久久精品日产第一区二区三区乱码 | 91系列在线播放| 日韩黄色一级视频| 久久成人国产| 91精品国产九九九久久久亚洲| 色欲人妻综合网| 成人在线一区| 国产视频一区在线| 亚洲精品乱码久久| 国产成人福利av| 日韩欧美亚洲一区二区| 亚洲综合20p| 欧美极品在线| 欧美日韩精品免费观看视频 | 久久成人综合网| 国产精品www色诱视频| 一区二区三区福利视频| 欧美久久99| 久久福利视频网| 中文字幕五月天| 欧美精品国产| 欧美激情精品久久久久久久变态| 色欲一区二区三区精品a片| 日韩欧美视频专区| 日韩视频精品在线| 在线观看天堂av| 国产精品成人av| 久久久av网站| 青青草偷拍视频| 国内精品久久久久久久影视蜜臀 | 黄色片在线观看网站| 久久久久久久久久久妇女 | av最新在线观看| 欧美永久精品| 欧美激情免费在线| 久久不卡免费视频| 日韩精品乱码免费| 国产欧美日韩综合精品| 国产美女永久免费| 风间由美性色一区二区三区 | 91精品国产高清自在线| 国产一区二区视频免费| 久久精品免费看| 亚洲精品欧美极品| 日本黄视频在线观看| 91丨porny丨中文| 亚欧精品在线| 91麻豆免费在线视频| 亚洲不卡一区二区三区| 国产熟女高潮视频| 日韩经典一区| 日韩女优电影在线观看| 人妻在线日韩免费视频| 精品国产aⅴ| 一区二区三区美女xx视频| 中文字幕无码日韩专区免费 | 亚洲人成无码www久久久| 成人国产精品| 欧美不卡在线视频| 波多野吉衣中文字幕| 97在线精品| 亚洲 日韩 国产第一| 嫩草影院一区二区三区| 国产成人丝袜美腿| 日本一区二区三不卡| 日韩特级毛片| 在线国产电影不卡| 在线播放第一页| 日韩片欧美片| 91高清在线免费观看| 一级片视频免费| caoporen国产精品视频| 亚洲精品高清视频| 51精品视频| 欧美一区二区三区思思人| 国产精品揄拍100视频| 91精品91| 国产精品久久久久99| www精品国产| 中文字幕乱码一区二区免费| 欧美一级免费播放| 4438五月综合| 亚洲欧洲免费视频| 国产无遮挡又黄又爽| 理论片日本一区| 精品亚洲欧美日韩| 国产精品实拍| 欧美色涩在线第一页| 中文字幕 亚洲一区| 一区二区影院| 成人免费午夜电影| 黄色av免费在线观看| 五月天一区二区| 日本女人黄色片| 欧美www视频在线观看| 欧美性视频在线| 东京干手机福利视频| 中文字幕在线不卡一区二区三区| 免费高清在线观看免费| 91亚洲无吗| 欧美成人精品在线| 亚洲一级特黄毛片| 欧美国产一区二区在线观看| 一本大道熟女人妻中文字幕在线| 中文无码日韩欧| 久久成人一区二区| 国产乱码久久久久| 国产精品福利电影一区二区三区四区| 欧洲av无码放荡人妇网站| 国产伦精品一区二区三区免费优势| 美日韩精品免费观看视频| 一区二区视频网站| 91色porny蝌蚪| 久章草在线视频| 精品一区不卡| 黄色日韩在线| 91精品国产乱码久久久久久蜜臀 | 日本午夜精品一区二区| 九九热在线视频播放| 成人aaaa免费全部观看| 国产va亚洲va在线va| av成人综合| 韩国精品久久久999| 三级网站在线看| 日韩欧美999| 久久精品—区二区三区舞蹈| 日日摸夜夜添夜夜添精品视频| 欧美日韩在线不卡一区| 天天综合网站| 在线播放日韩欧美| 中文字幕无线码一区| 中文字幕在线一区二区三区| 亚洲高清av一区二区三区| 欧美在线网站| 狠狠色综合色区| 一区二区乱码| 中文字幕亚洲自拍| aa视频在线免费观看| 一个色妞综合视频在线观看| 一级少妇精品久久久久久久| 久久av一区| 尤物国产精品| 成人在线视频中文字幕| 欧美综合在线第二页| 亚洲成人影院麻豆| 日韩网站在线看片你懂的| 五月婷婷激情网| 中文字幕av一区二区三区免费看| 午夜xxxxx| 亚洲精品123区| 亚洲国产精品123| 日韩成人精品| 国产成人在线播放| 黄色在线观看网站| 亚洲欧美日韩国产精品| 国产又粗又猛视频免费| 亚洲成人7777| 99re6热在线精品视频| 成人综合激情网| wwwwxxxx日韩| 韩国久久久久| 亚洲区一区二区三区| 嗯用力啊快一点好舒服小柔久久| 国产成人在线精品| mm视频在线视频| 色999日韩欧美国产| 天天躁日日躁狠狠躁伊人| 欧美三级在线看| 国产成人免费观看视频 | 黄色一级片在线| 久久久久久毛片| 麻豆av免费看| 蜜臀av一区二区在线免费观看| 国产免费裸体视频| 欧美大片aaaa| 欧美三级网色| 国产一区二区三区不卡av| 国产在线日韩在线| 女生影院久久| 久久人人爽人人| 91大神xh98hx在线播放| 日韩激情av在线免费观看| 精品国产乱码一区二区三 | 国产精品美女www爽爽爽| 潘金莲一级淫片aaaaa| 久久精品国产秦先生| 免费日韩视频在线观看| 亚洲二区在线| 成年人深夜视频| 亚洲国产精品成人| 亚洲在线播放电影| 国产探花一区在线观看| 亚洲一区二区影院| 欧美在线观看成人| 一区视频在线| 欧美性猛交内射兽交老熟妇| 99国产精品一区二区| 日韩视频在线观看国产| 亚洲第一福利专区| 精品日韩美女| 国产精品香蕉| 国产精品国产三级国产专区53| 成人97精品毛片免费看| 国产欧美一区二区三区四区| 91精品国产66| 国产精品久久久久久久久免费| 亚洲色图官网| 26uuu国产精品视频| 黄色在线网站噜噜噜| 国内自拍欧美激情| 国产高清中文字幕在线| 午夜伦理精品一区| 天堂中文av在线资源库| 91av在线不卡| 天堂电影一区| 国产99久久久欧美黑人| se69色成人网wwwsex| 国产精品日韩专区| 国产激情欧美| 国产一区香蕉久久| 国产精品亚洲一区二区在线观看| 成人在线观看视频网站| 日本精品一区二区三区在线观看视频| 亚洲综合第一页| 福利在线一区| 国内精品久久国产| 国产成人3p视频免费观看| 亚洲精品国产系列| 伊人久久大香线蕉综合四虎小说 | 黑人巨大精品欧美一区二区小视频 | 综合一区在线| 欧美狂野激情性xxxx在线观| 亚洲经典在线看| 人妻有码中文字幕| 免费久久精品视频| 人人爽人人爽av| 成人性生交大片免费看中文| 国产草草浮力影院| 久久久噜噜噜久久人人看| 精品手机在线视频| 一级女性全黄久久生活片免费| 日本少妇激情舌吻| 色视频一区二区| 国产精品美女一区| 日韩免费看网站| 天堂网av2014| 日韩精品极品毛片系列视频| 国产一级片在线播放| xxxxx成人.com| 999福利在线视频| 国产不卡在线观看| 国产精品久久久久久av公交车| 肥熟一91porny丨九色丨| 亚洲第一福利社区| av不卡在线免费观看| 亚洲美女色禁图| 中文字幕成人免费视频| 成人福利视频在线看| 伊人影院综合网| 亚洲一区二区三区四区在线| 在线观看亚洲黄色| 欧美成人性福生活免费看| 天堂在线中文字幕| 日韩中文字幕在线| 国产精品论坛| 91网站在线免费观看| 你微笑时很美电视剧整集高清不卡| 伊人色综合影院| 国产日韩高清一区二区三区在线| 国产91色在线观看| 99国产麻豆精品| 永久免费看mv网站入口| 欧美性xxxx极品hd满灌| 亚洲精品国产suv一区| 最近2019年好看中文字幕视频| free性欧美16hd| 国产精品久久久久久久久久久久久 | 久久九九99视频| 成人免费视频网站入口::| 在线观看国产日韩| 手机在线观看免费av| 久久艳片www.17c.com| 日本韩国欧美国产| 午夜精品福利一区二区三区av| 午夜精品福利在线视频| 日本精品免费观看高清观看| 秋霞视频一区二区| 久久伊人精品天天| 日韩制服诱惑| 蜜桃传媒视频麻豆第一区免费观看| 中文在线日韩| 亚洲视频一二三四| 久久亚洲一区二区三区四区| 久久成人国产精品入口| 91精品久久久久久蜜臀| 成人免费在线电影| 国产成人亚洲综合青青| 亚洲欧洲免费| 黄页免费在线观看视频| 国v精品久久久网| 亚洲色图综合区| 欧美一区二区三区思思人 | 精品国产欧美成人夜夜嗨| 日韩精品99| 欧美日韩国产高清视频| 亚洲女同在线| 懂色av粉嫩av蜜乳av| 午夜欧美一区二区三区在线播放| 亚洲成人77777| 欧美丰满少妇xxxxx做受| 日本超碰一区二区| 热这里只有精品| 国产一区二区三区高清播放| 日本黄色录像视频| 欧美福利一区二区| 国产在线激情视频| 亚洲综合av影视| 亚洲性色视频| 国产草草浮力影院| 日韩欧美亚洲一二三区| 毛片免费在线播放| 国产精品久久久久77777| 日韩欧美一区二区三区在线视频 | 国产精品99久| 久久网一区二区| 亚洲精品电影网| **欧美日韩在线观看| 日韩免费电影一区二区三区| 欧美96一区二区免费视频| 又色又爽的视频| 8x福利精品第一导航| 三级黄色片播放| 久久亚洲精品伦理| 亚洲黄色免费视频| 欧美男男青年gay1069videost| 五十路在线观看| 国产91色在线| 国产精品久久久久久久久妇女| 97人人模人人爽人人澡| 亚洲国产你懂的| 欧美一区二区少妇| 国产精品丝袜久久久久久高清| 婷婷丁香综合| 黄色激情在线观看| 日韩欧美成人网| 在线视频1区2区| 国产精品综合久久久久久| 亚洲免费影视| www.xx日本| 亚洲国产福利在线| se01亚洲视频| 女人床在线观看| www国产亚洲精品久久麻豆| 一本久道久久综合无码中文| 欧美激情精品久久久久| 欧美精品系列| 国产清纯白嫩初高中在线观看性色| 懂色av一区二区三区| 99免在线观看免费视频高清| 国产成人亚洲欧美| 奇米777欧美一区二区| 久一区二区三区| 最新的欧美黄色| 北条麻妃一区二区三区在线|