精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

不用RLHF,匹敵GPT-4!Meta重磅發布LIMA 65B,1000個樣本性能飛升,LeCun轉贊

人工智能
RLHF并沒有那么重要!Meta最新650億參數模型LIMA,僅用1000個樣本,實現與GPT-4相匹敵的性能。

人人都知,讓ChatGPT稱霸天下的秘密武器,就是人類反饋強化學習(RLHF)。

而現在,Meta AI等機構的爆火研究LIMA直接打破這一規則,直言RLHF并沒有那么重要!

論文一出,直接在AI圈炸了鍋!

就連LeCun忍不住發推炫一番:LIMA:LLaMa-65B+1000監督樣本=GPT-4/Bard級別的性能。

圖片

正如標題所稱,LIMA是「Less is More for Alignment」,暗示著一個強大的預訓練AI模型,通過幾個樣本就足以實現高質量的結果。

而LIMA僅在1000個精心挑選的樣本上微調LLaMa-65B,而且無需RLHF,就實現了與GPT-4和Bard相媲美的性能。

圖片

論文地址:https://arxiv.org/abs/2305.11206

論文中,研究人員將這一突破稱為「表面對齊假設」(Superficial Alignment Hypothesis)。

實驗證明了,大語言模型在預訓練階段就已習得大部分知識,僅用有限的指令微調數據,足以教會模型產生高質量的內容。

高質量的數據就可以克服小樣本量?訓練這樣模型的成本是多少,這是否意味著小型LLM玩家可以與OpenAI/谷歌競爭?

圖片

還有網友質疑,GPT-4在57%情況中擊敗LIMA,還能說性能相當?

圖片

RLHF并非王者?

大語言模型經過預訓練,能在大規模上預測下一個token,讓其學習通用表征。這些表征可以轉移到幾乎任何語言理解或生成任務中。

為了實現這種轉移,人們已經提出各種「對齊」語言模型的方法,主要側重在百萬級token上進行指令調優。

而最近采用較多的是,從人類反饋中進行強化學習(RLHF)。這些反饋便是在與人類標注者進行數百萬次互動中收集的。

ChatGPT令人深刻的表現,主要歸功于RLHF。根據OpenAI的思路,RLHF分為三步。

圖片

然而,現有的對齊方法代價是高昂的,需要大量算力,以及專門的數據才能實現像ChatGPT一樣的性能。

Meta AI卻要逆行其道,證明了,一個預訓練語言模型可以通過簡單地微調精心挑選的1000個樣本,就能實現強大的性能。

在此,研究人員提出「表面對齊假設」(Superficial Alignment Hypothesis),假設「對齊」可以是一個簡單的過程,。

在這個過程中,模型的知識和能力幾乎完全是在預訓練期間學習的,而「對齊」只告訴模型學習與用戶交互的風格或格式

圖片

為了驗證這個假設,Meta等研究者挑選了1000個近似于真實用戶提示,以及高質量響應的樣本。

他們從其他研究論文、WikiHow、StackExchange和Reddit等來源進行手動挑選,訓練數據的總量大約是750,000個token。

圖片

訓練提示(輸入)、響應(輸出)以及測試提示的來源

此外,研究者手動編寫了250個提示和響應的樣本,同時對任務的多樣性進行了優化。

最后,研究人員對預訓練LLaMa 65B模型在1000個樣本集上進行微調,并進行了人類評估。

評估結果

Meta將LIMA與5個模型基準進行了比較:(在2023年4月期間,對所有基準的響應進行了采樣)

Alpaca 65B——利用52,000個樣本對LLaMa 65B微調后得到的大模型

DaVinci003——基于RLHF訓練的大語言模型

Bard——基于谷歌的PaLM模型

Claude——通過強化學習Constitutional AI訓練的52B參數模型

GPT-4——目前使用RLHF訓練的最強的模型

為了比較LIMA和其他SOTA模型,Meta為每個測試提示生成一個單一的響應。

然后,要求人類參與者將LIMA的輸出與每個基準進行比較,并標記他們更喜歡哪一個。

在人類偏好研究中,盡管Alpaca 65B的訓練數據量是LIMA的52倍,但它產生的輸出往往比LIMA的不如人意。

圖片

讓人大跌眼鏡的是,DaVinci003也是同樣的情況,雖然程度較小。該模型使用了RLHF進行訓練,這本應是一種更優越的對齊方法。

而Bard在42%的時間中,其產生的回答優于LIMA。這也意味著,剩下的58%時間里,LIMA的響應至少和Bard一樣優秀。

最后,研究者發現,雖然Claude和GPT-4通常表現得比LIMA更好,但在一些情況下,LIMA實際上能產生更好的回答。

另外,諷刺的是,在GPT-4的偏好研究中,有19%的時間,GPT-4更喜歡LIMA的輸出。

圖片

「表面對齊假設」

Meta將這一發現定義為「表面對齊假設」(Superficial Alignment Hypothesis)。

它表明,所謂預訓練后的對齊階段,主要是讓模型學會一種特定的風格或格式,這種風格或格式在與用戶交互時可以被模型回憶起來。

因此,「微調」更多是關于風格,而不是實質。

LIMA的結果表明,實際上,利用簡單的方法就可以解決對齊和微調AI模型這類復雜問題。

這與諸如OpenAI的RLHF那些,特別繁瑣和復雜的微調過程,形成了鮮明的對比。

不過,LIMA也不是萬能的。Meta認為,該方法存在兩個明顯的局限:

第一,用高質量的示例構建數據集是一種非常具有挑戰性的方法,很難擴展。

第二,LIMA并不像已經有產品的模型那樣強大,比如GPT-4。

團隊表示,雖然LIMA的生成結果,在大部分情況下質量都很高。但一個「對抗性的提示」或一個「不走運的樣本」,依然會讓模型產生不理想的答案。

Yann LeCun對GPT-4和類似模型背后努力的相對貶值采取了務實的看法。

他將大型語言模型看作是近期的一個元素,至少在中期內不會「在沒有重大變化」的情況下發揮作用。

以上,主要評估是根據最先進的模型對LIMA進行評估,但需要明確的是,其中一些模型實際上已經在訓練期間使用了數百萬真實用戶的提示。

對此,研究人員通過手動分析50個隨機示例來進行絕對的評估。

并將每個示例標記成3個類別:Fail,響應不符合提示符的要求;Pass,響應符合;Excellent,對提示提供了優秀的響應。

實驗結果顯示,50%的LIMA回答被認為是優秀的,它能夠遵循所有的50個分析提示中的44個。

圖片

如下,LIMA針對育兒建議和生成食譜的示例進行的輸出。

圖片


另外,一個僅在1000個樣本上微調的模型在多輪對話中表現又如何?

在零樣本上,LIMA的響應出奇地連貫,并引用了前面對話的信息。在10次對話中,LIMA有3次未能遵循提示。

為了提高對話能力,研究人員收集了30個多輪對話。其中10個是由作者手動編寫,20個來自Stack Exchange,并根據助手風格進行編輯。

研究者使用組合的1,030個示例對預訓練模型進行微調,得到一個新版本的LIMA,并針對相同的提示進行了10次實時對話。

實驗發現加入這30個示例后生成質量顯著提升,優質響應比例從45.2%提高到76.1%!

圖片

LIMA如何以「少」勝「多」

團隊通過消融實驗,研究了訓練數據多樣性、質量和數量的影響。

Meta發現,為了對齊目的,提高輸入多樣性和輸出質量有可測量的正面效應,而單獨增加數量卻沒有。

實驗設置

團隊在各種數據集上微調了一個擁有70億參數的LLaMa模型,并控制了相同的超參數。

團隊對每個測試集提示抽取5個回應,并通過讓ChatGPT(GPT-3.5 Turbo)在1-6的Likert量表上評級回應的幫助性來評估回應質量。

多樣性

為了測試提示多樣性的影響,同時控制質量和數量,團隊比較了在質量過濾后的Stack Exchange數據和wikiHow數據上的訓練效果。

圖5顯示,更多樣的Stack Exchange數據顯著提升了模型的性能。

質量

為了測試響應質量的影響,團隊從Stack Exchange抽取了2000個沒有任何質量或風格過濾的示例,并比較了在這個數據集和過濾后的數據集上訓練的模型。

圖5顯示,在過濾和未過濾的數據源上訓練的模型之間存在著0.5點的差異。

圖片

數量

在眾多機器學習設置中,都會采用增加示例數量的策略,來提升性能。

為了測試其影響,團隊從Stack Exchange中抽取了呈指數增長的訓練集。

但實際上,如圖6所示,數據翻倍的訓練集并未改善響應質量。

如此一來也暗示了,對齊的規模法則不必然只受數量影響,而更可能是在保持高質量響應的同時,提升提示的多樣性。

圖片

作者介紹

Chunting Zhou是Meta AI的一名研究科學家。

2022年5月,她在卡內基梅隆大學語言技術研究所獲得博士學位,在那里從事自然語言處理工作,導師是Graham Neubig。Zhou的主要研究興趣在于自然語言處理和機器學習的交叉領域,并對開發對分布變化具有魯棒性的方法感興趣,目的是學習模型能夠在各種群體中表現統一。

此外,Zhou還研究生成模型,及其在自然語言處理任務中的應用。

圖片

參考資料:

https://arxiv.org/abs/2305.11206

責任編輯:武曉燕 來源: 新智元
相關推薦

2024-01-18 13:38:00

AI數據

2023-04-10 09:23:36

模型AI

2023-06-19 08:19:50

2024-06-28 12:31:22

2023-11-01 19:03:58

GPT-4

2023-09-11 15:57:16

人工智能模型GPT-4

2025-04-16 09:35:03

2023-10-31 15:26:02

阿里云通義千問

2024-04-19 10:32:08

2024-02-07 12:13:03

AI模型

2023-08-14 08:04:13

2023-10-11 13:09:09

OpenAI模型GPT-4

2023-03-16 17:28:59

技術AI

2023-04-04 09:09:10

GPT-4編程程序員

2024-04-19 14:52:13

MetaGPT-4模型

2025-05-30 07:40:56

2023-03-15 07:49:57

GPT-4ChatGPT

2024-06-05 08:29:35

2023-11-26 17:14:05

2023-03-27 17:45:16

研究AI
點贊
收藏

51CTO技術棧公眾號

97精品国产一区二区三区| 成人影欧美片| 国产精品视区| 亚洲精品自在久久| 欧美日韩在线成人| av在线电影网| 国内外成人在线视频| 欧美疯狂做受xxxx高潮| 女同性恋一区二区三区| 美女精品导航| 成人涩涩免费视频| 欧美亚洲视频一区二区| 国产7777777| 亚洲第一二区| 日韩欧美主播在线| 亚洲一区影院| 懂色av一区二区三区四区| 国产亚洲成人一区| 国产精品久久久久影院亚瑟| 国产精品av电影| 欧美美女性生活视频| 91精品久久久久久综合五月天| 亚洲成人av在线电影| 免费看国产精品一二区视频| 四虎精品永久在线| 久久久久国产| 亚洲精品资源在线| www.色就是色.com| 国产99在线| 欧美国产日韩精品免费观看| 91在线精品观看| 无码人妻久久一区二区三区| 欧美精品国产| 一本色道久久综合狠狠躁篇的优点| 8x8x成人免费视频| 偷拍视频一区二区三区| 亚洲黄色性网站| 欧洲视频一区二区三区| 丁香花免费高清完整在线播放| 欧美aa在线视频| 久久久久这里只有精品| 午夜激情福利电影| 北条麻妃在线一区二区免费播放| 色琪琪一区二区三区亚洲区| 伊人久久青草| 日韩一级免费毛片| 激情综合五月天| 国产精品r级在线| av大片免费在线观看| 国产精品久久久久久久| 亚洲美女在线看| 一级全黄裸体片| 久久三级毛片| 在线观看一区日韩| 男人添女人下面高潮视频| 主播国产精品| 亚洲欧美视频一区| 亚洲一区二区精品在线| 国产一级网站视频在线| 91热门视频在线观看| 99中文字幕| 国产美女精品视频国产| 激情图区综合网| 国产欧美中文字幕| 亚洲精品无码久久久久| 天堂在线一区二区| 久久久久久国产精品久久| 神马久久精品综合| 午夜精品视频一区二区三区在线看| 永久免费毛片在线播放不卡| 69精品无码成人久久久久久| 亚洲综合福利| 亚洲欧美日韩天堂| 白白色免费视频| 亚洲婷婷丁香| 亚洲女人天堂网| 欧美成人午夜精品免费| 成午夜精品一区二区三区软件| 欧美日韩在线播放三区| 乌克兰美女av| 久久亚洲资源中文字| 欧美日韩亚洲丝袜制服| 一本一道久久a久久综合蜜桃| 精品3atv在线视频| 欧美日韩亚洲精品内裤| 黄色激情在线视频| 国产后进白嫩翘臀在线观看视频| 亚洲一区二区成人在线观看| 日韩中字在线观看| 天堂√中文最新版在线| 一本色道久久综合狠狠躁的推荐| 男人操女人免费软件| 韩国成人动漫| 欧美性一级生活| 亚洲xxx在线观看| 国产精品一区二区三区四区在线观看 | 国产激情视频一区| 日本成人一级片| 精品制服美女久久| 99久久精品久久久久久ai换脸| 国产av无码专区亚洲av麻豆| 国产69精品久久99不卡| 狠狠色噜噜狠狠色综合久 | 色呦呦在线资源| 午夜视频在线观看一区二区三区| 男人操女人免费| 福利一区二区三区视频在线观看 | 少妇黄色一级片| 国产精品麻豆| 亚洲精品黄网在线观看| 日本激情小视频| 国产精品久久久久久影院8一贰佰 国产精品久久久久久麻豆一区软件 | 色噜噜在线观看| 色综合久久一区二区三区| 久久97精品久久久久久久不卡| 老妇女50岁三级| 国产精品v日韩精品v欧美精品网站 | 欧美激情国内偷拍| 无码日韩精品一区二区| 国产一区在线视频| 久久这里精品国产99丫e6| 午夜激情视频在线| 午夜婷婷国产麻豆精品| 亚洲免费黄色录像| 欧美一区二区三区红桃小说| 中文字幕不卡在线视频极品| 天天干天天操天天拍| 欧美一区影院| 欧美最顶级的aⅴ艳星| 国产同性人妖ts口直男| 91网站最新网址| 最新中文字幕久久| 成人性生交大片免费观看网站| 91精品免费观看| 欧美大片免费播放器| 日韩欧美一区免费| 青青草99啪国产免费| 国产夫妻性生活视频| 久久午夜免费电影| www.好吊操| 亚洲精品三区| 一道本无吗dⅴd在线播放一区 | 26uuu国产| 欧美成人milf| 国产精品成熟老女人| 五月天婷婷社区| 亚洲激情综合网| 国产淫片av片久久久久久| 国产不卡精品在线| 色悠悠久久久久| 无码视频在线观看| 久久综合色之久久综合| av在线播放亚洲| 日韩中文一区二区| 久久夜精品香蕉| 91片黄在线观看喷潮| 欧美激情一区二区三区在线| 欧美视频免费播放| 欧美激情在线精品一区二区三区| 97成人超碰免| 精品国产乱码久久久久久蜜臀网站| 久久人人97超碰com| 3d动漫一区二区三区| 一区二区在线免费播放| 欧美人与性动交| 精品久久久久中文慕人妻| 亚洲人成亚洲人成在线观看图片| www.cao超碰| 99精品国产一区二区三区| 国产精品免费视频xxxx| 成人在线观看网站| 欧美无砖专区一中文字| 一区二区视频观看| 亚洲深夜福利| 欧美高清性xxxxhd| 欧洲亚洲两性| 国产一区二区三区在线观看网站| 日本视频在线观看免费| 久久久精品天堂| 日韩中文字幕二区| 超碰成人久久| 成人情趣片在线观看免费| 激情影院在线观看| 日韩欧美亚洲国产精品字幕久久久 | 亚洲综合伊人| 久久国产精品影片| 亚洲国产成人一区二区| 亚洲国产成人91porn| 久久人人爽人人人人片| 久久久人人人| 亚洲一区二区不卡视频| 午夜久久av| 久久99国产精品自在自在app| 亚洲毛片欧洲毛片国产一品色| 午夜电影网亚洲视频| xxxwww国产| 国内在线观看一区二区三区| 久久综合九色欧美狠狠| 成人在线爆射| 久久精品亚洲热| 懂色av一区二区三区四区| 色婷婷亚洲婷婷| 欧美爱爱免费视频| 不卡高清视频专区| 九色porny91| 午夜日韩激情| 欧美一区2区三区4区公司二百| 在线观看v片| 色偷偷av亚洲男人的天堂| 亚洲国产精彩视频| 色琪琪一区二区三区亚洲区| 国产盗摄x88av| 久久综合中文字幕| 中文字幕乱妇无码av在线| 新67194成人永久网站| 偷拍盗摄高潮叫床对白清晰| 国产精品一线| 国产精品亚洲аv天堂网| 日韩影视在线| 中文字幕亚洲无线码a| 亚洲精品无码久久久| 欧美性一二三区| 亚洲精品在线观看av| 国产亚洲成aⅴ人片在线观看| 久久精品一卡二卡| 性高湖久久久久久久久| 久久久无码中文字幕久...| 伊人久久大香线蕉无限次| 91丝袜美腿美女视频网站| 久久久久久久| 久久欧美在线电影| 毛片免费不卡| 精品国产乱码久久久久久影片| 欧美视频xxxx| 精品国产户外野外| 麻豆成人在线视频| 国产精品福利av| 蜜臀久久99精品久久久久久| 成人国产一区二区三区精品| 在线播放黄色av| 日本在线播放一区二区三区| 国产96在线 | 亚洲| 欧美国产免费| 日韩精品久久久免费观看 | 99免费在线观看视频| 久久麻豆视频| 国产精品日本精品| 亚洲成人激情社区| 日韩免费不卡av| 国产精品高颜值在线观看| 色综合五月天导航| а√中文在线8| 久久久精品电影| 97视频在线观看网站| 亚洲网站视频福利| 色呦呦免费观看| 精品国产sm最大网站| www.av黄色| 日韩三级视频中文字幕| 91久久久久国产一区二区| 欧美色偷偷大香| 进去里视频在线观看| 91豆麻精品91久久久久久| 少妇高潮av久久久久久| 性做久久久久久免费观看欧美| 日本天堂中文字幕| 一区二区三区四区蜜桃 | 亚洲视频免费看| 亚洲视频重口味| 综合欧美一区二区三区| 国产真实乱在线更新| 亚洲欧美色一区| 神马久久精品综合| 亚洲综合在线第一页| 久久久夜色精品| 香蕉成人啪国产精品视频综合网| 国产在线综合网| 第一福利永久视频精品| 天天操中文字幕| 色老汉一区二区三区| 久久久精品免费看| 91国产丝袜在线播放| 中国a一片一级一片| 欧美日韩国产另类一区| 国产一区二区三区黄片| 欧美一级一区二区| 深夜福利视频网站| 亚洲欧美日韩天堂一区二区| 国产视频第一区| 揄拍成人国产精品视频| 日本精品在线| 欧美寡妇偷汉性猛交| 日产福利视频在线观看| 国产精品高清免费在线观看| 成人噜噜噜噜| 激情小说综合网| 欧美三级伦理在线| avove在线观看| 一区二区三区四区在线观看国产日韩| 久久综合亚洲精品| 亚洲在线免费| 中文字幕网av| 成人性生交大片| 夜夜春很很躁夜夜躁| 亚洲国产激情av| 蜜臀av午夜精品久久| 欧美日韩国产中文字幕| 曰批又黄又爽免费视频| 亚洲第一网站免费视频| а√天堂中文在线资源bt在线| 欧美成人午夜剧场免费观看| 日韩av一卡| 91久久国产自产拍夜夜嗨| 中文精品一区二区| 青草全福视在线| 亚洲午夜久久久久久尤物| 日韩av播放器| 丁香激情综合五月| 国产在线综合视频| 亚洲午夜精品17c| 一道本在线视频| 日韩经典中文字幕在线观看| 国产精品剧情| 欧美最猛黑人xxxx黑人猛叫黄| 日韩免费成人| 日产精品高清视频免费| 91久久国产| 久草在在线视频| 成人av免费网站| 欧美成人777| 欧美中文字幕一区二区三区| 高h震动喷水双性1v1| 日韩视频在线免费观看| sm久久捆绑调教精品一区| 国产精品久久久久久亚洲调教| ady日本映画久久精品一区二区| 午夜精品一区二区在线观看 | 久久亚洲综合色| 久久精品亚洲无码| 欧美日韩专区在线| 免费看男男www网站入口在线| 欧美国产乱视频| 国产成年精品| 中文精品视频一区二区在线观看| 翔田千里一区二区| 不卡视频一区| 日韩精品久久久久久久电影99爱| 免费黄色日本网站| 91久色porny| 岛国av中文字幕| 亚洲图片在线综合| 国产福利一区二区三区在线播放| 神马影院我不卡午夜| 日韩成人免费在线| 精品女人久久久| 91精品欧美一区二区三区综合在 | 国内精品久久久久伊人av| 久久草在线视频| 亚洲人成色77777| 中文字幕+乱码+中文字幕一区| 亚洲综合精品国产一区二区三区| xxxx性欧美| 成人av婷婷| 国产xxxxx在线观看| 国产日韩一级二级三级| 一本一道精品欧美中文字幕| 欧美大胆a视频| 日本在线中文字幕一区| 中文字幕第21页| 亚洲青青青在线视频| 亚洲国产精品成人久久蜜臀| 欧美一级视频免费在线观看| 欧美精选一区二区三区| 99re精彩视频| 亚洲午夜私人影院| 久久国产精品高清一区二区三区| 91精品美女在线| 亚洲高清免费| 手机看片日韩av| 日韩午夜激情电影| 国产伦精品一区二区三区视频金莲| 亚洲一区三区| 不卡一区二区三区四区| 在线观看国产精品视频| 欧美高清不卡在线| 精品72久久久久中文字幕| 中文字幕剧情在线观看| 亚洲七七久久综合桃花剧情介绍| 日韩免费中文字幕| 91av精品| 国产传媒第一页| 337p亚洲精品色噜噜噜| а√天堂8资源在线| 亚洲欧美日产图| thepron国产精品| 亚洲天堂自拍偷拍| 2019中文字幕在线| 亚洲自拍偷拍网| 欧美成人另类视频| 欧美精品一区二|