精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Meta再放「長文本」殺器Llama 2-Long:70B尺寸登頂最強「32k上下文」模型,超越ChatGPT

人工智能 新聞
Llama 2-Long計算量需求比重新訓練降低40%,還不影響短任務性能!

雖然大型語言模型在處理日常問答、總結文本等任務上表現非常出色,但如何讓LLM在不顯著增加計算需求、不降低短文本性能的前提下,能夠處理「超長文本輸入」仍然是一個難題。

最近,Meta團隊公開了支持長上下文的模型Llama 2 Long的訓練方法,該模型的有效上下文窗口多達32768個token,在各種合成上下文探測、語言建模任務上都取得了顯著的性能提升。

論文鏈接:https://arxiv.org/pdf/2309.16039.pdf

并且,模型在指令調優的過程中不需要借助人工標注的長指令數據,70B參數量的模型就已經在各種長上下文任務中實現了超越gpt-3.5-turbo-16 k的性能。

除了結果外,論文中還對模型的各個組件進行了深入分析,包括Llama的位置編碼,并討論了其在建模長依賴關系的限制;預訓練過程中各種設計選擇的影響,包括數據混合和序列長度的訓練策略。

消融實驗表明,在預訓練數據集中具有豐富的長文本并不是實現強大性能的關鍵,驗證了長上下文持續預訓練比從頭開始長序列預訓練更有效,同樣有效。

LLAMA 2加長版

1、持續訓練(Continual Pretraining)

由于注意力機制需要進行二次復雜度的計算,如果使用更長的輸入序列進行訓練會導致巨大的計算開銷,研究人員通過實驗對比了不同的訓練策略:從頭開始進行長序列(32768)預訓練、以及在不同階段(20%、40%、80%)從4096長度切換到32768的持續學習。

結果發現,在輸入token數量長度相同的情況下,兩個模型的性能幾乎相同,但持續訓練最多可以減少40%的FLOPs

位置編碼(Positional Encoding)

在持續預訓練中,LLAMA 2的原始架構基本沒有變化,僅針對長距離信息捕獲需求對位置編碼進行了修改。

通過對7B尺寸LLAMA 2模型的實驗,研究人員發現了LLAMA 2的位置編碼(PE)的一個關鍵局限性,即阻礙了注意力模塊匯集遠處token的信息。

圖片

為了進行長上下文建模,研究人員假設該瓶頸來源于LLAMA 2系列模型使用的RoPE位置編碼,并控制超參數基礎頻率(base frequency)從10, 000增加到500, 000來減少RoPE位置編碼中每個維度的旋轉角度,從而降低了RoPE對遠處token的衰減效應。

圖片

從實驗結果來看,RoPE ABF在所有位置編碼變體中取得了最好的效果,證明了簡單修改RoPE即可有效提升模型的上下文長度。

并且,研究人員也選擇沒有選擇稀疏注意力,考慮到LLAMA 2-70B的模型維h為8192,只有當輸入序列長度超過6倍h(即49,152)個token時,注意力矩陣計算和值聚合的成本才會成為計算瓶頸。

數據混合(Data Mix)

在使用改良版位置編碼的基礎上,研究人員進一步探索了不同預訓練數據的組合,通過調整 LLAMA 2 的預訓練數據比例或添加新的長文本數據來提高長上下文能力。

圖片

實驗結果發現,在長上下文、持續預訓練的設置下,數據質量往往比文本長度發揮著更關鍵的作用。

優化細節

研究人員持續增加預訓練LLAMA 2檢查點的輸入序列長度,同時保持與LLAMA 2相同的每批token數量;

對所有模型進行了100,000步共計400B個token的訓練;

使用Flash-Attention,當增加序列長度時,GPU 內存開銷幾乎可以忽略不計,使用70B模型的序列長度從4,096增加到 16,384 時,可以觀察到大約17%的速度損失;

對于7B/13B模型,使用學習率2e^-5和余弦學習率調度,預熱步驟為 2000 步;

對于較大的34B/70B模型,必須設置較小的學習率1e^-5才能獲得單調遞減的驗證損失。

2、指令微調(Instruction Tuning)

為LLM對齊收集人工演示和偏好標簽是一個繁瑣而耗時耗力的過程,在長上下文場景下,往往會涉及到復雜的信息流和專業知識,例如處理密集的法律/科學文檔,標注成本還會更高,所以目前大多數開源指令數據集主要由短樣本組成。

在這項工作中,研究人員發現一種簡單且容易實現的方法,可以利用預先構建的大型多樣化短提示數據集,在長語境基準測試中效果也出奇地好。

具體來說,首先使用LLAMA 2-Chat中使用的RLHF數據集,并用LLAMA 2-Chat本身生成的自指導(self-instruct)長數據對其進行擴充,預期模型能夠通過大量RLHF數據學習到一系列不同的技能,并通過自指導數據將知識轉移到長上下文的場景中。

數據生成過程側重于QA格式的任務:從預訓練語料庫中的長文檔開始,隨機選擇一個文本塊,并提示LLAMA 2-Chat根據文本塊中的信息編寫問答對,通過不同的提示收集長短格式的答案。

除此之外,生成過程還包括自我批判(self-critque)步驟,即提示LLAMA 2-CHAT驗證模型生成的答案。

給定生成的 QA 對,使用原始長文檔(已截斷以適應模型的最大上下文長度)作為上下文來構建訓練實例。

對于短指令數據,將其連接為16,384個token序列;對于長指令數據,在右側添加填充token以便模型可以單獨處理每個長實例,而無需截斷。

雖然標準指令微調只計算輸出token的損失,但同時計算長輸入提示的語言建模損失也可以提升下游任務的性能。

實驗結果

1、預訓練評估

短任務

要使長上下文LLM具備普遍實用性,一個重要的要求是確保其在標準短上下文任務中的強大性能。

圖片

在短任務實驗中,可以看到其結果與LLAMA 2相當,而且在大多數情況下比LLAMA 2要更強,在編碼、數學和知識密集型任務(如 MMLU)上的結果有明顯改善,優于GPT-3.5

圖片

相比其他長上下文方法在短任務的不佳表現,研究人員將該模型的性能改進歸功于額外的計算FLOPs以及從新引入的長數據中學到的知識。

長任務

之前的方法大多依靠易錯性和合成任務來衡量模型在長上下文場景下的性能,與此不同,研究人員使用真實世界的語言任務來進行長上下文的評估:

在NarrativeQA上評估零樣本性能,在QuALITY和Qasper上評估2-shot性能,在QMSum上評估1-shot性能,具體的樣本數根據每個數據集的平均樣本長度決定。

使用的提示非常簡單「{Context} Q: {Question}, A:」,可以減少評估誤差;如果提示語超過模型的最大輸入長度或16,384個詞組,輸入提示語將從左側截斷。

圖片

對比其他開源長上下文模型,在 7B 尺度上,只有Together-7B  32k可以與該模型的性能相媲美。

有效利用上下文(Effective Context Utilization)

為了驗證該模型能夠有效利用增加的上下文窗口,從實驗中可以看到,隨著上下文長度的增加,每個長任務的結果都在單調地改善。

圖片

除此之外,模型的語言建模損失與上下文長度呈冪律加常數的比例關系,結果表明,盡管收益遞減,但該模型在 32,768 個文本token以內仍然顯示出性能增益(語言建模損失),更大的模型可以更有效地利用上下文。

圖片

2、指令微調結果

研究人員在ZeroSCROLLS基準上對指令微調模型進行測試,包含10個長上下文數據集,如摘要、問題回答和多文檔聚合任務。

為了進行公平比較,模型設置為相同的提示、截斷策略和最大生成長度等。

實驗結果顯示,在不使用任何人類標注的長上下文數據的情況下,70B的chat模型在10項任務中的7項都優于gpt-3.5-turbo-16k

如果使用更多不同的數據進行微調,研究人員預計其性能還會進一步提高。

值得一提的是,評估長上下文LLM是一項比較困難的任務,基準中使用的自動指標在很多方面都有局限性,例如只有單個參考的文本摘要,n-gram也不一定符合人類偏好。

3、人類評估

作為自動評估基準結果的補充,通過詢問標注人在有用性、誠實性和無害性等方面,更喜歡來自文中提出的指令微調模型,還是來自MPT-30B-chat、GPT-4、GPT-3.5-turbo-16k和Claude-2等專有模型的生成來進行人工評估。

與自動度量不同,人類更擅長評估長上下文模型的模型響應質量,因為可接受答案的空間很大。

研究人員主要關注兩個應用場景,評估模型利用信息(檢索到的文檔)來回答給定查詢的能力。

1)多回合對話數據,每個提示都是聊天歷史,模型需要基于聊天歷史生成一致的響應;

2)多文檔搜索查詢應答應用,該模型提供了從搜索會話中檢索到的幾個最相關的文檔以及相應的搜索查詢。

總共2352個樣本,其中每個樣本由3個不同的人類標注人員進行評估,模型相對于其他模型的標準勝率是通過平均每個比較示例的結果來計算的。

可以看到,Llama 2 Long只需要很少的指令數據就可以實現與MPT-30B-chat、GPT-3.5-turbo-16k和Claude-2相近的性能。

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-03-25 00:05:00

開源模型AI

2023-08-29 12:45:32

2025-01-14 12:22:06

2023-06-30 09:49:23

模型Meta

2023-06-28 18:10:27

羊駝家族大模型集體進化

2023-08-24 15:57:41

模型文檔檢索

2024-04-19 08:01:01

Llama 3 8BMeta

2025-04-07 09:35:00

Meta模型開源

2023-08-25 13:27:00

模型開源

2023-10-13 19:58:33

Mistral7B模型

2025-07-09 09:23:19

2024-06-05 08:33:29

2024-06-03 14:24:00

2025-01-08 09:30:00

Meta大模型訓練

2023-06-27 13:48:00

清華開源

2023-05-14 14:15:00

GPT-4AI

2025-06-03 00:00:09

AI長上下文推理 RL大模型

2023-11-22 16:51:53

2024-07-02 09:20:59

點贊
收藏

51CTO技術棧公眾號

国产二级一片内射视频播放| 色婷婷久久av| 国产精品无码av在线播放| 色一情一乱一区二区三区| 亚洲一区一卡| 在线电影中文日韩| 麻豆av免费看| 色老太综合网| 亚洲欧美另类小说| 精品国产乱码久久久久久88av| 在线观看日韩中文字幕| 日韩在线第七页| 亚洲成人亚洲激情| 爱爱爱爱免费视频| h片视频在线观看| 国产日韩一级二级三级| 亚洲最大的av网站| 久久中文字幕免费| 青青草成人影院| 精品久久久久一区| 邪恶网站在线观看| 青青青免费在线视频| 中文字幕一区二区视频| 久久亚洲免费| 精品国产无码AV| 免费成人在线观看视频| 91高清在线免费观看| 亚洲色图100p| 九九综合久久| 亚洲精品在线电影| 亚洲欧美日韩网站| av亚洲一区| 欧美日韩中文字幕日韩欧美| 性欧美videosex高清少妇| 成人免费一级视频| 国模无码大尺度一区二区三区| 欧美亚洲视频在线观看| 精品亚洲永久免费| 五月激情综合| 中文字幕无线精品亚洲乱码一区 | 日韩国产欧美三级| 韩国视频理论视频久久| 欧美人与禽zozzo禽性配| 日韩精品诱惑一区?区三区| 日韩精品极品视频| 国产精品无码在线| 加勒比色老久久爱综合网| 日韩欧美在线观看一区二区三区| 自拍偷拍一区二区三区四区| 最新日韩三级| 色婷婷综合中文久久一本| 国产午夜大地久久| 黄色18在线观看| 亚洲成人综合在线| 日本一区午夜艳熟免费| 在线视频国产区| 亚洲久草在线视频| 奇米777四色影视在线看| 国产精品刘玥久久一区| 中文字幕一区二区三区视频| 亚洲一二区在线| 91欧美在线视频| 国产精品天天看| 一本久道久久综合狠狠爱亚洲精品| 欧美女优在线观看| 国产日韩成人精品| 亚洲国产欧美不卡在线观看| 97超碰国产一区二区三区| 国产精品免费av| 一区二区日本| 永久免费网站在线| 午夜久久电影网| 欧美日韩在线中文| 亚洲国产尤物| 91麻豆精品国产91久久久久久| 色91精品久久久久久久久| 国产一区二区三区国产精品| 欧美精品丝袜久久久中文字幕| 亚洲精品乱码久久久久久动漫| 日韩精品视频一区二区三区| 亚洲成色999久久网站| free性中国hd国语露脸| 国产中文精品久高清在线不| 日韩中文字幕视频在线| 91久久久久久久久久久久久久| 亚洲影视一区| 97国产在线观看| 精品国产www| 国产精品系列在线播放| 91手机在线播放| 日本私人网站在线观看| 欧美国产禁国产网站cc| 九九久久九九久久| 午夜影院一区| 欧美日韩一级片在线观看| 超碰在线超碰在线| 外国成人在线视频| 日日噜噜噜夜夜爽亚洲精品| 劲爆欧美第一页| 日韩中文字幕区一区有砖一区 | 伦av综合一区| 激情深爱一区二区| 精品国产一二| 免费在线看黄网站| 欧美日韩国产综合视频在线观看中文| 激情五月婷婷久久| 亚洲免费一区三区| 在线观看国产精品日韩av| 免费一级肉体全黄毛片| 日本欧美一区二区| 国产精品一区二区欧美黑人喷潮水| 久久伊伊香蕉| 亚洲成在人线在线播放| 日本精品一区在线| 欧洲杯足球赛直播| 91高清视频在线免费观看| 99精品免费观看| 国产视频一区不卡| 奇米影视亚洲色图| 91成人小视频| 一区二区在线免费视频| 国产成人无码精品亚洲| 国产一区二区在线影院| 日韩久久久久久久久久久久久| 亚洲按摩av| 欧美日韩aaaaaa| 女人又爽又黄免费女仆| 亚洲二区视频| **亚洲第一综合导航网站| 亚洲乱亚洲乱妇| 日本久久电影网| 黄色工厂在线观看| 999亚洲国产精| 国产福利久久精品| av网站免费在线观看| 欧美日韩中文字幕一区| 精品无码一区二区三区| 亚洲精品孕妇| 国产日本一区二区三区| 天堂av最新在线| 91精品午夜视频| 亚洲熟女少妇一区二区| 久久精品国产免费| 日韩久久在线| 成人黄色毛片| 丝袜美腿精品国产二区| 中文字幕一区二区三区四区视频| 国产香蕉久久精品综合网| 欧美一区二区三区爽大粗免费| 高清精品视频| 性色av一区二区三区免费| 内射后入在线观看一区| 亚洲一区二区高清| 色哟哟视频在线| 最新日韩av| ts人妖另类在线| 欧美性猛片xxxxx免费中国 | 国产成人精品在线播放| 日本精品专区| 色婷婷久久久久swag精品| 一道本在线观看| 日本视频一区二区| 手机福利在线视频| 日韩中文字幕| 97色伦亚洲国产| 欧美色18zzzzxxxxx| 色婷婷综合视频在线观看| av免费播放网站| 久久精品999| 三级在线免费观看| 国产+成+人+亚洲欧洲在线| 97视频在线观看网址| 免费黄色在线视频网站| 欧美性大战久久久久久久蜜臀| 亚洲第一综合网| 国产自产高清不卡| 97中文字幕在线| 日韩高清影视在线观看| 国产精品久久久久9999| gogo在线观看| 亚洲国产欧美一区二区三区同亚洲 | 国产区高清在线| 欧美日韩精品一二三区| www.99re7| jiyouzz国产精品久久| 国产主播在线看| 色喇叭免费久久综合网| 成人午夜两性视频| 日韩在线资源| 日韩欧美激情在线| 在线观看国产亚洲| 国产精品欧美久久久久一区二区| 999在线观看| 欧美日韩综合| 久久视频在线观看中文字幕| 国产私拍福利精品视频二区| 久久久国产精品视频| 亚洲精品国产精| 在线视频一区二区免费| 九九精品视频免费| 成人午夜av在线| 自拍偷拍21p| 午夜电影亚洲| 免费国产一区| 91麻豆精品一二三区在线| 91国内精品久久| 日本在线视频站| 精品1区2区在线观看| 国产乡下妇女三片| 亚洲一区二区精品3399| 成人免费视频入口| 成人美女视频在线观看18| 九一精品在线观看| 亚洲激情女人| 亚洲AV无码成人精品一区| 欧洲亚洲一区二区三区| 成人性生交大片免费看视频直播 | 国产欧美日韩精品一区二区三区| 成人黄在线观看| 日韩三级影视| 97精品一区二区视频在线观看| 精品孕妇一区二区三区| 亚洲欧洲一区二区三区久久| 99视频在线观看免费| 欧美日韩精品中文字幕| 日本中文在线视频| 久久女同精品一区二区| 蜜桃视频无码区在线观看| 视频一区中文字幕国产| 日韩中文字幕在线免费| 欧美日韩hd| 在线免费观看一区二区三区| 亚洲欧美成人vr| 99久久国产免费免费| 欧美一级二级视频| 欧美一区在线直播| 狂野欧美激情性xxxx欧美| 精品国产拍在线观看| 国产裸舞福利在线视频合集| 日韩电影中文字幕在线| a级片免费观看| 精品视频1区2区| 黄色在线免费观看| 午夜精品久久久久久久久| 好吊日免费视频| 成人国产一区二区三区精品| 三级一区二区三区| 久久婷婷影院| 国产a视频免费观看| 亚洲精品孕妇| 日韩五码在线观看| 国产精品啊啊啊| ijzzijzzij亚洲大全| 久久精品国产www456c0m| 日韩中文一区二区三区| 国产亚洲精品美女久久| 国内精品视频免费| 国产三级精品三级在线观看国产| 国产不卡一区二区三区在线观看| 玖玖精品一区| 亚洲aⅴ男人的天堂在线观看| 日韩制服一区| 国产精品丝袜视频| 欧美在线se| 国产精品久久久av| 蜜桃麻豆av在线| 91av视频在线免费观看| 末成年女av片一区二区下载| 91精品国产色综合| 亚洲一区站长工具| 国产成人综合精品在线| 日韩av超清在线观看| 国产精品久久久久久久久久久久久久| 亚洲不卡系列| 国产精品入口夜色视频大尺度| 国产精品黄色片| 91性高湖久久久久久久久_久久99| 欧美极品在线| 成人美女av在线直播| 国产专区精品| 国产精品久久久久久免费观看| 日韩精选在线| 日本精品一区二区| 午夜激情久久| 老太脱裤子让老头玩xxxxx| 国产精品腿扒开做爽爽爽挤奶网站| 国产h视频在线播放| 久久国产精品亚洲77777| 天天色综合天天色| 国产乱码精品一区二区三区五月婷| 欧美体内she精高潮| 国产成人久久精品77777最新版本 国产成人鲁色资源国产91色综 | 亚洲精品高清无码视频| 久久成人久久爱| 亚洲av综合色区无码另类小说| 99久久777色| 我想看黄色大片| 亚洲最大的成人av| 国产区一区二区三| 91精品国产综合久久香蕉麻豆| 成人免费公开视频| 亚洲人成电影网站色…| 欧美18一19xxx性| 午夜精品一区二区三区视频免费看 | av白虎一区| 国产欧美日韩丝袜精品一区| 91精品短视频| 日韩少妇中文字幕| 欧美日韩亚洲一区二区三区在线| www黄色日本| 国产另类ts人妖一区二区| 国产乱了高清露脸对白| 中文av一区二区| 好吊操这里只有精品| 色综合久久99| 99国产在线播放| 国产一区二区三区在线| 人人超在线公开视频| 57pao国产成人免费| www一区二区三区| 欧美高清性xxxxhd| 欧美国产专区| 国产熟人av一二三区| 成人综合婷婷国产精品久久免费| www.久久av| 亚洲一区二区三区四区五区中文| 国产乡下妇女三片| 精品第一国产综合精品aⅴ| 蜜芽在线免费观看| 热久久视久久精品18亚洲精品| 蜜桃在线一区| 最新中文字幕久久| 日韩高清欧美激情| 人妻少妇精品视频一区二区三区| 亚洲乱码中文字幕综合| 中文字幕一级片| 日韩av最新在线| 久久青青色综合| 亚洲aⅴ日韩av电影在线观看| 91精品精品| 中日韩av在线播放| 欧美国产1区2区| 波多野结衣电车| 亚洲欧美日韩成人| 日韩av一卡| 国产一区二区无遮挡| 午夜精品视频| 黄色手机在线视频| 国产亚洲精品资源在线26u| www..com国产| 日韩一区二区三区高清免费看看| av男人的天堂在线| 国产精国产精品| 蜜桃一区二区| 日av中文字幕| 久久久精品国产99久久精品芒果| 国产尤物在线视频| 日韩成人激情视频| 日韩理论视频| 欧美日韩天天操| 中文亚洲字幕| 免费观看污网站| 一区二区高清在线| 亚洲图片在线播放| 久久精品2019中文字幕| 国产乱码精品一区二区三区亚洲人| 国产四区在线观看| 国产一区二区三区四区在线观看| 永久免费看mv网站入口| 在线不卡的av| 色爱综合区网| 极品校花啪啪激情久久| 久久久久久久久丰满| 免费高清视频在线观看| 亚洲素人一区二区| 99国产在线播放| 国模吧一区二区| 亚洲区小说区图片区qvod按摩| www黄色av| 国产精品久久看| 国产绿帽一区二区三区| 欧美国产日韩中文字幕在线| 激情视频亚洲| 国产亚洲黄色片| 丁香激情综合五月| 免费黄色片视频| 久久久精品在线| 国产精品jk白丝蜜臀av小说| 每日在线更新av| 国产精品污污网站在线观看| 97视频免费在线| 久久久久久这里只有精品| 外国成人在线视频| 一本之道在线视频| 天天综合色天天综合| 国产一区二区影视| 成人综合网网址| 亚洲精选在线| 欧美做爰啪啪xxxⅹ性| 日韩av中文字幕在线免费观看|