精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

面向超長上下文,大語言模型如何優化架構,這篇綜述一網打盡了

人工智能 新聞
作者重點關注了基于 Transformer 的 LLM 模型體系結構在從預訓練到推理的所有階段中優化長上下文能力的進展。

ChatGPT 的誕生,讓基于 Transformer 的大型語言模型 (LLM) 為通用人工智能(AGI)鋪開了一條革命性的道路,并在知識庫、人機交互、機器人等多個領域得到應用。然而,目前存在一個普遍的限制:由于資源受限,當前大多 LLM 主要是在較短的文本上進行預訓練,導致它們在較長上下文方面的表現較差,而長上下文在現實世界的環境中是更加常見的。

最近的一篇綜述論文對此進行了全面的調研,作者重點關注了基于 Transformer 的 LLM 模型體系結構在從預訓練到推理的所有階段中優化長上下文能力的進展。

圖片

論文鏈接:https://arxiv.org/pdf/2311.12351.pdf

論文首先分析了使用當前基于 Transformer 的模型處理長上下文輸入和輸出的問題。然后,提供了一個全面的分類體系,以指導 Transformer 架構升級的領域,來解決這些問題。作者對長上下文 LLM 廣泛使用的評估需求進行了調研,包括數據集、度量標準和基準模型,以及一些令人驚奇的優化工具包,如庫、系統和編譯器,以增強 LLM 在不同階段的效率和功效。最后,文章進一步討論了這一領域未來研究的主要挑戰和潛在方向。作者還建立了一個倉庫,匯總了相關文獻,并提供實時更新 https://github.com/Strivin0311/long-llms-learning。

綜述概覽

文章從基本的語言建模目標 (第 2.1 節) 開始,內容涵蓋從典型的建模階段到在基于 Transformer 的僅解碼 LLM 中找到的關鍵架構模塊,如圖 1 (a) 所示。隨后,作者對 LLM 在遇到擴展上下文窗口時的架構限制進行了簡要分析 (第 2.2 節)。最后提出了一個全面的方法論分類法 (第 2.3 節),旨在通過架構創新增強 LLM 的長上下文能力 (見圖 1 (b))。這個分類法作為文章的第 3、4、5、6、7 節的指南。

圖片圖 1:文章核心概述:(a) 現代基于 Transformer 的僅解碼 LLMs 的典型架構解剖圖,右上角有圖例;(b) 用于增強 Transformer 架構模塊的方法論分類法(與 (a) 相對應的顏色):高效注意力(注意力核心的子模塊),長期記憶(針對 KV 緩存),外推性 PEs(針對位置嵌入模塊),上下文處理(與上下文預 / 后處理有關)和雜項(整個解碼器塊以及損失模塊通用)。

長上下文,目前有哪些難點待突破?

注意力復雜度。在典型情況下 L ? d,MHA 的計算復雜性可以簡潔總結如下:它涉及 O (L 2d) 的時間復雜度,包括 QKV 投影的 O (Ld2),計算 P 的 O (L 2d),通過 softmax 運算獲取 A 的 O (L 2 ),A 與 V 相乘的 O (L 2d),以及輸出投影 O 的 O (Ld2)。它還產生 O (L 2) 的空間復雜度,包括 Q、K、V、O 的嵌入的 O (Ld),以及額外的 O (L 2) 緩沖區用于存儲權重 P 和 A。因此,隨著序列長度的增加,時間和空間計算成本都呈二次增加,這對于訓練和推理可能都是繁重的。

上下文記憶。LLM 缺乏顯式的記憶機制,完全依賴 KV 緩存來存儲列表中所有先前 token 的表示。這種設計一旦在一個調用中完成查詢,Transformer 在后續的調用中不會保留或召回任何先前的狀態或序列,除非整個歷史記錄逐個 token 重新加載到 KV 緩存中。因此,Transformer 在每個調用中僅具有一個上下文工作記憶,而不是像長短時記憶 (LSTM) 這樣的內在記憶機制。這種無狀態性在并行性方面提供了計算優勢,但在聊天機器人應用等需要長期記憶保留的任務中的挑戰很明顯。

最大長度約束。在訓練階段,工程師通常需要確定一個關鍵的超參數 max-length,本文中表示為 L_max。這個超參數代表了批次中任何訓練樣本的序列長度的上限,通常根據可用的計算資源設置為 1k、2k 或 4k,以避免在 GPU 上發生內存溢出 (OOM) 錯誤。在推理階段,LLM 的服務提供者還必須限制用戶提示的長度或自動截斷它們以與預定義的 L_max 對齊,即使推理資源通常比訓練階段更豐富。需要注意的是 Transformer 的任何模塊在本質上都不需要這樣的限制,因為所有學習的權重僅依賴于維度大小。因此,理論上只要資源足夠,Transformer 可以處理任意長度的序列。然而,當前的語言模型在處理超過 L_max 的輸入序列時通常表現出明顯的性能下降,經常導致重復和不切實際的輸出。

改進的新方法

對于上述限制,有多種改進方法可以探索,例如在訓練過程中減少注意力復雜性、設計高效的記憶機制,以及增強長度外推的能力,該模型在短序列上進行訓練,但在推理過程中對更長的序列進行測試。

因此,論文全面回顧了致力于改進 LLM 長上下文能力的各個階段的最新方法,并將它們組織成一個統一的分類法,如圖 1 (b) 所示。具體而言,這些方法被分為五個主要的類別,如下:

高效注意力 (論文第 3 節):這些方法側重于實現具有降低計算要求的高效注意力機制,甚至實現了線性復雜度。通過這樣做,它們能夠通過直接在預訓練階段增加 L_max 來推進 LLM 在推理期間的有效上下文長度邊界。

長期記憶 (論文第 4 節):為了解決上下文工作記憶的局限性,一些方法旨在設計明確的記憶機制,彌補 LLM 中缺乏高效和有效的長期記憶的不足。

外推性 PEs (論文第 5 節):最新的研究致力于通過改進現有位置編碼方案的外推性能來增強 LLM 的長度泛化能力。

上下文處理 (論文第 6 節):除了增強特定低級 Transformer 模塊的方法外,一些方法涉及對現成的 LLM 與額外的上下文預 / 后處理。這些方法確保每次調用 LLM 時輸入始終滿足最大長度要求,并通過引入多個調用開銷打破上下文窗口限制。

雜項 (論文第 7 節):探討了各種一般且有價值的方法,這些方法不容易歸入前面四類,為推進 LLM 的長上下文能力提供了更廣泛的視角。

未來方向

論文的第 3、4、5、6 節中討論了該領域取得的顯著進展,但仍然存在一些挑戰。下面是對一些關鍵挑戰的探討以及未來在增強基于 Transformer 的 LLM 的長上下文能力方面進行研究和開發的潛在方向,重點關注架構的增強。

注意力 Trade-off。在第 3 節,作者探討了高效注意方法往往涉及在保持全尺度注意力依賴性(例如局部注意力)或通過近似注意力提高注意力分數精度以減輕標準注意內核的計算需求之間的微妙權衡。然而,隨著上下文的延長,話語結構和相互關聯的信息變得越來越復雜,需要捕捉全局、長距離的依賴性,同時保持精確的相關性。

解決這一挑戰需要在計算效率和盡可能保留注意模式精度之間找到最佳平衡。因此,在長上下文 LLM 領域,這仍然是一個持續追求的目標。最近的創新如 Flash Attention,探索了算法級別之外的 IO 感知解決方案,極大地提高了運行時和記憶開銷的效率,而不會喪失注意精度。這是在實際應用中解決這個問題的一個激動人心的潛在途徑。此外,可以探索在「即插即用」替代方案中集成先前的高效策略,利用強大的 GPU 內核編程工具 (如 CUDA) 或更輕量級的 Triton。

記憶效果和效率。正如在文章第 2.1、2.2 節中前面討論的,作者已經概述了由于缺乏明確的記憶機制,僅依賴上下文內工作記憶以及在延長上下文交互期間 KV 緩存記憶消耗顯著增加而產生的限制。這些挑戰共同強調了在基于 Transformer 的 LLM 領域需要更有效和高效的記憶機制。雖然第 4 節中引入了各種長期記憶機制,但它們受到其復雜啟發式設計引入的額外記憶開銷的限制,因此隨著時間的推移可能導致性能下降。為了解決這一挑戰,研究人員可以從最近的進展中汲取靈感,比如 Paged Attention,研發更有效的記憶存儲策略,增強讀 / 寫吞吐量。

長度外推挖掘。在第 5 節中,作者對與基于 Transformer 的模型的長度外推相關的挑戰進行了徹底的分析,重點關注了位置嵌入的普遍設計。文章提供了對最近突破的全面概述,特別是應用于 RoPE 的擴展策略,作者相信這在解決外推限制方面具有重要的前景。值得注意的是,這些進步往往依賴于對復雜高維位置嵌入屬性的簡化觀察,并包含簡單的啟發式調整。作者對使用高維嵌入來建模序列性的理論基礎提出質疑,并探索在這些啟發式設計的指導下引導具有許多超參數的可學習嵌入的潛在復蘇。作者認為未來的研究應該深入探討這一領域,尤其是在 Transformer 設置下為建模序列性開發健壯的理論框架方面,比如 CLEX 所實現的內容。

特定但通用目標。前文已經為長文本建模量身定制的具體目標做了討論,但值得注意的是,許多目標僅限于某些類型的任務,或者僅與 MLM 目標兼容,而不是如今更普遍的 CLM 目標。這突顯了需要特定但普遍適用的因果語言建模目標,可以在模型訓練的早期有效捕捉長距離依賴性。通過與先前提到的目標相一致,這是可能實現的。

可靠的度量需求。在評估度量方面,文章的第 8 節中研究了許多可選項。根據在評估中的先前經驗,常用的度量,如 ROUGE 分數,與人類判斷分數存在顯著差異,后者可以看作是「神諭」。隨著 LLM 在現實世界場景中的快速部署,越來越迫切地需要更可靠的度量來評估長上下文能力,特別是在生成性任務中,其中精確的真實性難以捉摸。一個有希望的途徑涉及利用最先進的 LLM (如 GPT4) 的魯棒性作為人類評審的替代,盡管相關的高成本仍然在更廣泛地在研究界中采用方面帶來挑戰。

更多研究細節,可參見原論文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-12-02 09:40:00

2025-10-31 01:00:00

2024-04-03 10:05:00

LLM性能基準測試

2024-08-26 10:01:50

2025-10-27 09:38:26

2025-02-06 10:21:51

2024-04-26 00:25:52

Rust語法生命周期

2025-09-10 09:38:56

2025-09-08 08:20:00

AI大模型系統

2024-03-14 08:11:45

模型RoPELlama

2013-10-16 14:18:02

工具圖像處理

2024-09-30 14:10:00

2021-08-05 06:54:05

流程控制default

2012-07-30 16:29:40

架構架構模式.NET

2025-07-16 13:00:26

2024-01-17 13:59:00

AI開源

2024-02-27 10:11:36

前端CSS@規則

2021-10-11 07:55:42

瀏覽器語法Webpack

2020-09-27 10:37:51

谷歌Transformer機器學習

2011-12-02 09:22:23

網絡管理NetQos
點贊
收藏

51CTO技術棧公眾號

亚洲色图视频网| 久久精品国产99| 日韩电影免费观看中文字幕| 日韩在线视频在线观看| 成人免费在线视频网| 久久精品国产色蜜蜜麻豆| 美日韩精品免费视频| 日本一级片在线播放| 亚洲不卡系列| 亚洲一区二区不卡免费| 日韩精品电影网站| 精品人妻少妇AV无码专区| 午夜在线一区二区| 久久躁日日躁aaaaxxxx| av网站免费在线播放| 中文字幕在线高清| 国产午夜一区二区三区| caoporen国产精品| 亚洲图片欧美日韩| 国产精品v日韩精品v欧美精品网站| 欧美三级在线看| 欧美黄网在线观看| 97电影在线看视频| 99国产一区二区三精品乱码| 国产女精品视频网站免费| 国产黄色片视频| 久久电影院7| 亚洲韩国欧洲国产日产av| 夜夜夜夜夜夜操| 台湾佬成人网| 亚洲a一区二区| 麻豆md0077饥渴少妇| 国产午夜在线观看| 99久久er热在这里只有精品66| 国产不卡精品视男人的天堂| 精品午夜福利在线观看| 91精品99| 色先锋资源久久综合5566| 一本色道久久综合亚洲精品图片| 国产精品美女久久久久人| 在线影视一区二区三区| 18岁网站在线观看| 精灵使的剑舞无删减版在线观看| 久久精品日产第一区二区三区高清版| 国产精品永久在线| 999视频在线| 亚洲欧美日韩国产| 91精品国产色综合久久不卡98口| 91麻豆免费视频网站| 成人嘿咻视频免费看| 亚洲人成网7777777国产| 久久久久久久久免费看无码| 美国一区二区| 日韩av一区二区在线观看| 男人网站在线观看| 国产成人av毛片| 精品区一区二区| 亚洲五月激情网| 国产精品一区免费在线 | 亚洲我射av| 欧美日韩一本到| 日本中文字幕精品—区二区| 狠狠久久综合| 7777精品伊人久久久大香线蕉超级流畅 | 日韩精品在线不卡| 亚洲国产一区二区精品专区| 九九久久久久久久久激情| 国产极品国产极品| 你懂的成人av| 久久久伊人日本| 国产成人在线播放视频| 国产精品主播| 国产97在线|亚洲| 日本成人一级片| 精品一区二区免费在线观看| 69堂成人精品视频免费| 乱精品一区字幕二区| 91视频你懂的| 亚洲乱码一区二区三区| av网址在线| 午夜精品久久久久久久99水蜜桃| 国产资源在线免费观看| 亚洲男人av| 欧美日韩激情在线| 女人扒开腿免费视频app| 高清欧美性猛交xxxx黑人猛| 亚洲日韩欧美视频一区| 97在线观看免费高| 亚洲国产裸拍裸体视频在线观看乱了中文| 国模精品视频一区二区| 亚洲乱码国产乱码精品| 黄网站免费久久| 国产自产在线视频一区| av在线免费观看网站| 一区二区三区不卡在线观看| 欧美视频第一区| av国产精品| 日韩精品在线观看一区二区| 国产大屁股喷水视频在线观看| 午夜片欧美伦| 91精品国产电影| 一级黄色大毛片| av影院午夜一区| 亚洲精品成人久久久998| 黑人精品视频| 欧美三级日本三级少妇99| 97中文字幕在线观看| 欧美日韩色图| 午夜精品www| 一级特黄色大片| 2021国产精品久久精品| 日本道在线视频| 3d性欧美动漫精品xxxx软件| 日韩欧美视频一区| 奇米网一区二区| 亚洲永久视频| 不卡一卡2卡3卡4卡精品在| 成年人免费在线视频| 亚洲成人在线网站| 香蕉视频色在线观看| 不卡一区综合视频| 97在线免费观看视频| jizz中国女人| 国产精品久久久久国产精品日日| 大荫蒂性生交片| 国产一区二区三区| 中文在线资源观看视频网站免费不卡| 国产67194| 免费国产亚洲视频| 美女一区视频| 久草在线资源福利站| 日韩精品一区二区三区在线| 人人艹在线视频| 喷白浆一区二区| 欧美日韩免费精品| 日本不卡网站| 亚洲国产欧美在线成人app | 亚洲主播在线播放| 激情文学亚洲色图| 97在线精品| 国产精品美女无圣光视频| 人成在线免费视频| 欧美日韩精品在线观看| 国产伦精品一区二区免费| 国内视频精品| 国产二区一区| 久久电影网站| 亚洲高清在线观看| 日韩欧美大片在线观看| 不卡的电视剧免费网站有什么| 中文字幕色一区二区| 欧美极品在线| 久久手机免费视频| 国产成a人亚洲精v品无码| 亚洲欧美日韩中文播放| 韩国三级丰满少妇高潮| 你懂的国产精品| 国产高清一区视频| 国产白浆在线免费观看| 精品无码久久久久久国产| 精品国产xxx| 欧美激情综合五月色丁香小说| 成人在线激情网| 成人黄色av| 97超级碰碰| а√在线天堂官网| 日韩乱码在线视频| 日韩av免费播放| 亚洲天堂精品视频| 免费看毛片的网站| 日本大胆欧美人术艺术动态| 亚洲图片小说在线| 亚洲超碰在线观看| 777午夜精品福利在线观看| 精品一二三区视频| 欧美另类高清zo欧美| 欧美极品aaaaabbbbb| 成人av网站免费观看| 亚洲中文字幕无码中文字| 精品日韩欧美一区| 96久久精品| 91精品韩国| 欧美精品一区在线播放| 香蕉视频黄色片| 欧美日韩精品免费观看视频| 国产亚洲精品码| 国产亚洲综合色| 91香蕉视频免费看| 亚洲制服少妇| 精品国产一区二区三区在线| 女同久久另类99精品国产| 国产精品福利在线观看| 青春草在线视频| 国产亚洲日本欧美韩国| 99精品免费观看| 色哟哟一区二区在线观看 | 日韩在线观看一区| 成人黄色片视频网站| 91看片一区| 欧美激情精品久久久久久蜜臀| 天天摸天天碰天天爽天天弄| 欧美日韩亚洲不卡| 日本一区二区欧美| 最新国产精品久久精品| 97超碰在线资源| 国产成人av电影免费在线观看| wwwxxx黄色片| 亚洲人成久久| 欧美 另类 交| 精品国产一区二区三区| 国产精品自拍首页| 中文成人激情娱乐网| 日本精品视频在线观看| 色老头在线观看| 中文字幕日韩精品在线| 无码精品黑人一区二区三区| 欧美一区二区女人| 中文字幕 亚洲视频| 欧美午夜电影在线| 国产精品30p| 一区二区成人在线视频 | japanese国产精品| 好吊色欧美一区二区三区| av在线国产精品| 国产啪精品视频| 91精品影视| 欧美亚洲国产日本| 成人ssswww在线播放| 欧美俄罗斯乱妇| 成人日批视频| 久久精品亚洲精品| 日本在线观看| 色妞久久福利网| 91欧美在线视频| 一区二区三区无码高清视频| 青青操视频在线| 国产婷婷色综合av蜜臀av | free欧美| 欧美在线视频播放| 色综合桃花网| 欧美孕妇毛茸茸xxxx| 高清在线视频不卡| 5566成人精品视频免费| 一本大道色婷婷在线| 欧美在线视频一区| 日韩伦理三区| 国产精品久久久久久久久久免费 | 成人av毛片| 正在播放欧美视频| jizz在线免费观看| 最近中文字幕日韩精品| 久久日韩视频| 欧美成人合集magnet| 激情网站在线| 亚州欧美日韩中文视频| 无遮挡爽大片在线观看视频| 欧美最猛黑人xxxx黑人猛叫黄 | 国产精品99久久久久久久久久久久| av福利导福航大全在线| 欧美黄色免费网站| 国产高清视频色在线www| 欧美一级淫片丝袜脚交| 色综合一本到久久亚洲91| 国产精品视频在线观看| 亚洲三级在线| 高清视频在线观看一区| 欧美调教网站| 神马影院午夜我不卡| 99九九热只有国产精品| 日韩一级片一区二区| 亚洲国内精品| 国产精品涩涩涩视频网站| 免费人成在线不卡| 少妇丰满尤物大尺度写真| 成人福利电影精品一区二区在线观看| 免费欧美一级片| 99免费精品在线观看| 中文字幕第20页| 亚洲女爱视频在线| 成年免费在线观看| 欧美揉bbbbb揉bbbbb| 性一交一乱一精一晶| 日韩精品在线影院| 久久久久久国产精品免费无遮挡| 欧美裸身视频免费观看| 亚洲男人av| 亚洲综合社区网| 日韩福利视频一区| 正在播放久久| 国产农村妇女精品一区二区| 久久人人爽av| av激情综合网| 国产性生活大片| 欧美性猛交99久久久久99按摩| 亚洲系列在线观看| 亚洲精品wwwww| www在线观看播放免费视频日本| 欧美极品欧美精品欧美视频| 久久久成人av毛片免费观看| 成人91视频| 秋霞欧美视频| 可以在线看的av网站| 九九精品视频在线看| www.日本高清| 亚洲欧美一区二区三区国产精品 | 91一区二区三区| 欧美日韩久久精品| 99热自拍偷拍| 福利一区二区在线| 日韩av片在线免费观看| 欧美日韩免费观看中文| wwwxxxx国产| 色偷偷综合社区| 欧美男体视频| 国内视频一区二区| 欧美人成在线| 国产美女18xxxx免费视频| 91麻豆成人久久精品二区三区| 美女三级黄色片| 91搞黄在线观看| 亚洲 精品 综合 精品 自拍| 欧美另类第一页| 亚洲伦理一区二区| 午夜一区二区三区| 日日夜夜精品视频免费| 久久午夜夜伦鲁鲁片| 亚洲午夜羞羞片| 亚洲高清在线观看视频| 成人97在线观看视频| 日韩伦理一区二区| 亚洲狠狠婷婷综合久久久| 视频在线观看一区| 美女又爽又黄视频毛茸茸| 亚洲成人福利片| 亚洲男女视频在线观看| 欧美日韩成人网| 日韩一级淫片| 日韩a级黄色片| 国产福利精品一区二区| 2018天天弄| 91精品国产综合久久国产大片| 91女主播在线观看| 国产伊人精品在线| 99久久久久久中文字幕一区| 五月婷婷之婷婷| 亚洲女性喷水在线观看一区| 91麻豆成人精品国产免费网站| 中文字幕日韩视频| 日本成人在线网站| 熟女熟妇伦久久影院毛片一区二区| 蜜臀av性久久久久蜜臀aⅴ四虎 | 国产又黄又猛又粗又爽的视频| 久久亚洲精品国产精品紫薇| 伊人中文字幕在线观看| 亚洲一区第一页| 成人不卡视频| 吴梦梦av在线| 国产成人在线影院| 国产精品成人av久久| 日韩av在线最新| 日本美女久久| 日韩 欧美 自拍| 国产91精品一区二区| 99热国产在线观看| 国产亚洲精品91在线| 亚洲伦理久久| 欧美激情视频免费看| 久久人人爽爽爽人久久久| 最近中文字幕在线视频| 久久亚洲精品小早川怜子66| jizzjizzjizz欧美| 黄色a级片免费| 最新国产の精品合集bt伙计| 亚洲欧美激情国产综合久久久| 久久久久久网站| 免费黄色成人| 国产性生活一级片| 午夜成人免费电影| 97最新国自产拍视频在线完整在线看| 国产精品免费久久久久久| 午夜日韩激情| 免费在线观看污| 日韩一区二区三区四区五区六区| 三级福利片在线观看| 欧美性xxxx69| 国产毛片精品国产一区二区三区| 免费麻豆国产一区二区三区四区| 日韩av在线免费观看一区| 欧美极品在线| 欧美日韩黄色一级片| 亚洲欧美在线视频观看| 无码国产伦一区二区三区视频 | 国产欧美日韩网站| 国产欧美一区在线| 国精品人妻无码一区二区三区喝尿 | 欧美在线视频网| 亚洲午夜精品一区 二区 三区| 青青草精品在线| 91高清在线观看| 鲁鲁在线中文|