精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

賈佳亞團隊開源全球首個70B長文本大語言模型,讀論文看小說直接ProMax

人工智能 新聞
最近,香港中文大學賈佳亞團隊聯合MIT宣布了一項新研究,一舉打破如此僵局。

家人們,苦長文本久矣的大語言模型(LLM),現在終于有解法了!

就在最近,香港中文大學賈佳亞團隊聯合MIT宣布了一項新研究,一舉打破如此僵局:

發布全球首個70B參數的長文本開源大語言模型——LongAlpaca。

圖片

值得注意的是,這次團隊開源的LongAlpaca不止是一個單一的大語言模型,實則是一個系列,包括:

  • 中杯:LongAlpaca-7B
  • 大杯:LongAlpaca-13B
  • 超大杯:LongAlpaca-70B

而在它們完整訓練和評測的背后,更為關鍵的是研究團隊精挑細選、千錘百煉得來的長文本數據集LongAlpaca-12k

并且在自研的大語言模型文本長度拓展方案LongLoRA的加持之下,在最終的結果上取得了驚艷的成績——

只需兩行代碼、一臺8卡A100機器,便可將7B模型的文本長度拓展到100k tokens,70B模型的文本長度拓展到32k tokens。

要知道,現在主流的大語言模型都只支持短文本的輸入(LLaMa支持2k tokens、Llama2支持4k tokens);而我們在實際使用的過程中往往需要的是長文本的輸入。

例如讓大語言模型去解讀一本小說的劇情,再如讓它幫你分析一篇論文等等。

而以往開源大語言模型要想拓展文本的長度,基本上就是堆算力,動輒消耗100塊以上的GPU或TPU的那種。

不僅計算資源上的消耗巨大,更是由于缺少專精的數據集,使得長文本輸入得到結果也并非那么理想。

這也就是開頭我們提到“苦長文本久矣”的由來了。

那么賈佳亞領銜的研究團隊發布的LongAlpaca的效果具體又是如何呢?

現在一同來體驗下。

圖片

“全球首個”的一手體驗

既然是一手體驗,我們主打的就是要把LongAlpaca從方方面面來個評測。

分析某篇論文獲獎原因

首先我們小試牛刀一下,將一篇ICLR的Oral論文(共12487 tokens)“投喂”給LongAlpaca,讓它幫忙分析一下獲獎原因。

圖片

一篇論文的文本長度定然不會是像我們平時提問普通問題那般簡短,而且通篇的文字在邏輯上也是環環相扣,極具嚴謹性。

而LongAlpaca在面對如此專業性的論文,依舊是給出了較為完美的回答,分別從論文提出方法的新穎性、框架的綜合評價,以及實驗結果等關鍵要素進行了分析。

最后的總結是:

總而言之,這篇論文獲獎的關鍵原因是所提出的Domino方法和評估框架的新穎性、有效性和通用性,推動了切片發現的最新進展。全面的實驗評估和定量分析為支持概念貢獻提供了強有力的經驗證據。

根據兩篇論文分析會議風格的區別

從第一個評測內容來看,LongAlpaca對于一篇論文內容長度的處理上是完全拿捏的。

那么如果“投喂”兩篇,還是對比著來看的那種,它是否依舊能hold住呢?

話不多說,直接“丟進去”:

根據這兩篇論文,比較一下兩個會議的區別(共25802 tokens)。

圖片

同樣的,LongAlpaca依舊是從多個角度,方方面面地去回答這個問題——

論文的結構、技術的深度、理論與實驗、表示法,甚至是文章的語言風格,都給出了具體的分析結果。

最后LongAlpaca給出的結論是:

CVPR的文章風格更加具備結構化和實驗性,專注于描述一種計算機視覺任務的方法。

ICLR論文風格則是更靈活,專注于證明元學習見解的關鍵公式和理論分析。

提問名著章節

在感受完LongAlpaca對于論文的分析之后,我們繼續來看下它能否拿捏更具戲劇性的小說名著。

把《西游記》的節選片段(共36870 tokens)丟進去,并提問:

在《西游記》中,孫悟空為什么在大鬧天宮時期很厲害,但取經路上卻屢屢受挫?

圖片

LongAlpaca按照《西游記》的故事時間線,分析了在大鬧天宮時孫悟空的傲慢,后來被佛祖限制了能力,以及沿途的妖怪越發強大等種種的原因。

總結來說就是:

強大的對手、對他力量的限制、欺騙和缺乏同伴是他在旅途中失敗的最初原因;但隨著時間的推移,他獲得了智慧、經驗和戰友,使他最終能夠戰勝更為強大的敵人。

與Llama 2同臺競技

在自身縱向的各項評測后,定然也是少不了橫向的比較。

那么跟大語言模型開源界炙手可熱的Llama 2相比,LongAlpaca的表現又會如何呢?

這輪我們派出的是“大杯”——LongAlpaca-13B選手,向它提出的問題是:

根據《三體》第一部中的章節(共32252 tokens),葉文潔為什么要聯系外星人,而后期又為什么后悔?

圖片

LongAlpaca-13B可以說是較為精準地給出了答案:

葉文潔最初與外星人的接觸既是出于理想主義,也是出于復仇,但隨著時間的推移,她對人性的看法發生了變化,她意識到自己可能給全人類帶來了危險,她的遺憾也隨之增加。

反觀Llama 2這邊,同樣是13B量級的大語言模型,做出的回答就有些差強人意了,大部分文字并沒有圍繞問題本身。

只是簡單的提了一句:

最后她感到后悔,因為她意識到她的行為導致了她從未想過的后果。

圖片

總而言之,從種種的評測表現來看,LongAlpaca在處理長文本輸入的難題上確實是做到了較大優化。

那么接下來的一個問題便是:

怎么做到的?

左手抓數據右手抓策略,這便是LongAlpaca的應對之道。

在數據方面,正如我們剛才提到的,訓練長文本大語言模型的難點一方面在于缺少公開的長文本對話數據。

而且此前長文本模型的訓練,大多是在非對話的語料上用 “next-token-generation”的方式進行繼續預訓練。

這種方式雖然能夠align模型對于長文本的位置編碼格式,但缺點也很明顯,就是很難讓模型有較好的對話能力。

因此,賈佳亞團隊收集了9k條長文本問答語料對,包含針對名著、論文、深度報道甚至財務報表的各類問答。

其中,論文相關問答最為詳細,包括了“審稿”、“論文對比”、“會議風格對比”、“修改意見”,以及針對論文內容的提問等。

但畢竟揚了“長”也不能忘了“短”,因此賈佳亞團隊還從原有的Alpaca數據集中挑選了3k左右的短問答語料混合訓練。

最終,也就成功構建了我們前文提到的LongAlpaca-12k。

圖片

接下來,便是策略層面。

正如我們剛才提到的,此前在大語言模型長文本輸入問題上,另一個老大難的問題便是計算資源消耗量巨大。

具體而言,主要就是集中在了自注意力機制(self-attention)的計算上——開銷隨著文本長度成平方次地增加。

因此,研究團隊以此作為突破口,提出了在研的大語言模型文本長度拓展方案LongLoRA;與此同時,還采用了分組和偏移的方式來對全局自注意力機制進行模擬。

圖片

△LongLoRA設計概覽

其中,LongLoRA具體的關鍵技術點就是shift short attention,我們姑且稱之為偏置短注意力。

它的核心思想就是用sparse local attention(稀疏局部注意力)替換掉dense global attention(密集全局注意力)。

大概可以理解為檢索時的思想,只需要將匹配度、相似性高的centext拿過來用即可。

如此一來便可以大幅降低計算資源的消耗了。

圖片

△shift short attention示意圖

更重要的一點是,LongLoRA的訓練只需要2行代碼即可實現!

圖片

此外,LongLoRA還探索了低秩訓練的方式。原有的低秩訓練方式,如LoRA,無法在文本長度遷移上取得良好的效果。

而LongLoRA在低秩訓練的基礎上,引入嵌入層(Embedding layer和 Normalization layers)進行微調,從而達到可以和全參數微調(Full fine-tune)逼近的效果。

對于8k長度的模型訓練,相比于全參數微調,LongLoRA將顯存消耗從46.3GB降低到25.6GB。

對于64k長度的模型訓練,相比于常規LoRA,LongLoRA將訓練時間從90~100小時左右降低到52.4小時。

圖片

△全參數微調、常規LoRA和LongLoRA的性能比較

值得一提的是,LongLoRA在各類語言任務上,包括文本建模(Proof-pile、PG-19)、信息檢索(topic retrieval, passkey retrieval),都展現了優異的性能。

并且LongLoRA可以僅在一臺8卡A100機器上將7B模型的文本長度拓展到100k tokens,將70B模型的文本長度拓展到32k tokens,并且保持出色的語言建模性能。

圖片

如何部署?

對于如此“快、好、省”的項目,你是不是迫不及待地想要嘗鮮了呢?

現在,它已經在GitHub上開源,并給出了十分詳細的部署教程。

例如在安裝方面,僅需要簡單六步:

1、在GitHub中fork這個repo。

2、在本地機器上克隆存儲庫,使用git Clone并粘貼此項目的url。

3、運行如下代碼:

pip install -r requirements.txt
pip install flash-attn --no-build-isolation

4、根據偏好,使用“已發布模型”和“微調模型”。

5、通過對話測試模型。

6、部署到自己的demo。

以及還有各種“杯型”的模型、訓練過程代碼等等,團隊都在GitHub項目中詳細地展示了出來。

有需求的小伙伴可戳下方鏈接自取了~

GitHub項目地址:https://github.com/dvlab-research/LongLoRA

論文地址:https://browse.arxiv.org/pdf/2309.12307.pdf

責任編輯:張燕妮 來源: 量子位
相關推薦

2023-10-09 14:17:00

AI模型

2024-07-08 08:38:00

模型推理

2023-08-09 17:38:47

模型AI

2024-04-15 12:28:00

AI模型

2024-07-18 12:56:29

2023-10-04 10:38:38

模型方法

2025-01-24 14:14:35

模型框架視頻

2025-10-23 12:41:13

2024-03-19 13:12:36

自動駕駛模型

2023-08-14 13:29:37

2024-06-19 13:02:01

2024-05-30 12:50:05

2025-01-10 14:15:02

2023-10-11 13:21:12

模型數據

2024-09-09 08:50:00

2025-01-08 09:30:00

Meta大模型訓練

2023-12-10 15:05:47

AI模型

2024-09-14 09:31:00

2025-04-03 11:16:10

2023-09-13 13:21:52

模型數據
點贊
收藏

51CTO技術棧公眾號

精品一区二区在线视频| 豆花视频一区| 国产欧美一区视频| 成人性生交大片免费看小说| 欧美成人手机视频| 偷拍视屏一区| 在线电影国产精品| 人人妻人人做人人爽| av在线三区| 成人免费毛片片v| 国产精品久久久久av| 黄色一级片在线免费观看| 美女毛片一区二区三区四区| 欧美一区二区三区在线视频 | 久久久久久影院| 精品卡一卡二卡三卡四在线| 88av.com| 91高清视频在线观看| 国产精品区一区二区三区| 国产欧美综合精品一区二区| 一个人看的www日本高清视频| 在线日韩视频| 久久精品国产亚洲精品| 色呦呦一区二区| 狂野欧美xxxx韩国少妇| 欧美视频一区二区三区四区 | av最新在线观看| 性人久久久久| 亚洲成成品网站| 在线播放黄色av| 欧美日韩女优| 日韩欧美亚洲成人| 成人性免费视频| 丝袜综合欧美| 亚洲女与黑人做爰| 亚洲人成人77777线观看| 天堂在线免费av| 成人av资源在线| 国产精品10p综合二区| 国产精品嫩草影院精东| 奇米精品一区二区三区在线观看| 91成人天堂久久成人| 精品无码一区二区三区电影桃花| 99视频精品全部免费在线视频| 在线观看日韩欧美| 久久久视频6r| 任你躁在线精品免费| 亚洲国产免费av| 成人在线电影网站| 哺乳一区二区三区中文视频| 欧美tickling网站挠脚心| 国产资源中文字幕| 免费看日产一区二区三区| 3d动漫精品啪啪1区2区免费| 视频免费1区二区三区| 成人国产综合| 欧美人与性动xxxx| 久久久久xxxx| 国产亚洲久久| 精品免费日韩av| 亚洲少妇18p| 精品一区亚洲| 中文字幕在线视频日韩| 一本色道久久88| 亚洲成av人片乱码色午夜| 久久综合色88| 成人免费看片98| 99亚洲一区二区| 国产成人精品久久| 中文亚洲av片在线观看| 激情欧美一区二区| 成人蜜桃视频| 亚洲 欧美 自拍偷拍| 久久综合色天天久久综合图片| 蜜桃成人免费视频| 最近高清中文在线字幕在线观看| 中文字幕一区二区三区在线不卡 | caoporn91| 国自产拍偷拍福利精品免费一| 久久青草精品视频免费观看| 成人午夜淫片100集| 蜜桃av一区二区三区电影| 亚洲永久在线观看| 成人一区二区三区视频在线观看| 亚洲欧美日韩国产手机在线 | 亚洲黄色录像片| 久久成人福利视频| 综合日韩av| 3d动漫精品啪啪| 亚洲av无码一区二区三区网址| 伊人久久大香线蕉综合网站 | 久久精品国产免费| av在线不卡一区| 全色精品综合影院| 亚洲精选视频在线| 东京热加勒比无码少妇| 宅男噜噜噜66国产精品免费| 亚洲国产91色在线| 国产精品视频一区二区在线观看 | 久草精品在线播放| 久久九九精品视频| 亚洲欧洲一区二区三区在线观看| 国产黄色小视频网站| 亚洲国产专区| 91在线观看欧美日韩| 五月天婷婷激情网| 亚洲精品欧美在线| 538在线视频观看| 国产亚洲成av人片在线观黄桃| 色偷偷噜噜噜亚洲男人| 精品美女久久久久| 蜜桃精品在线观看| 欧美日韩一区二区视频在线| 日皮视频在线观看| 欧美剧在线免费观看网站| 久久国产精品无码一级毛片| 在线一区电影| 91精品国产自产在线观看永久| 三区在线视频| 亚洲成av人片在www色猫咪| 午夜精品久久久久久久99热影院| 四虎5151久久欧美毛片| 欧美日韩xxxxx| 亚洲无码精品在线观看| 国产亚洲制服色| 国模无码视频一区二区三区| 九九九九九九精品任你躁 | 黄色在线观看视频网站| 欧美日韩一区二区三区免费看 | 亚洲免费成人在线| 亚洲欧美视频一区| 天堂av8在线| 欧美一区二区性| 国产999精品| 天堂а在线中文在线无限看推荐| 夜夜嗨av一区二区三区四季av| 国产美女18xxxx免费视频| av中文字幕一区二区| 国产99久久精品一区二区永久免费| 亚洲男女视频在线观看| 亚洲人成影院在线观看| 亚洲色图欧美自拍| 仙踪林久久久久久久999| 成人春色激情网| 免费在线看黄| 91精品久久久久久蜜臀| 亚洲综合网在线| 国产美女一区二区| 8x8x华人在线| jazzjazz国产精品久久| 韩日精品中文字幕| 日韩国产福利| 在线欧美小视频| eeuss中文字幕| 久久精品久久久精品美女| 亚洲日本精品| 涩涩屋成人免费视频软件| 欧美精品久久久久| 色窝窝无码一区二区三区| 无吗不卡中文字幕| www.久久国产| 日日欢夜夜爽一区| 在线看视频不卡| 一区二区三区四区精品视频 | 国产成人精品av久久| 成人免费视频一区| 免费在线激情视频| 成人直播大秀| 99国产盗摄| 男女羞羞在线观看| 在线观看国产精品91| 国产精品久久欧美久久一区| 樱花草国产18久久久久| 一级欧美一级日韩片| 久久一区欧美| 一区二区三区日韩视频| 成人另类视频| 国产精品7m视频| 成人在线网址| 日韩精品免费在线观看| 中文字幕av网站| 亚洲一区二区在线观看视频| 黄色工厂在线观看| 久久se精品一区精品二区| 欧美这里只有精品| 激情五月色综合国产精品| 成人在线激情视频| 美女高潮在线观看| 久久人人爽人人爽爽久久| 成人午夜视频一区二区播放| 91精品办公室少妇高潮对白| 曰本女人与公拘交酡| 99久久免费精品| 色婷婷.com| 国产精品婷婷| 熟女熟妇伦久久影院毛片一区二区| 国产欧美自拍一区| 成人在线小视频| 大胆人体一区| 欧美大片第1页| aaa日本高清在线播放免费观看| 日韩免费福利电影在线观看| 精品视频一二三区| 亚洲高清三级视频| 卡通动漫亚洲综合| 久久久久久99久久久精品网站| 小早川怜子一区二区三区| 美女网站久久| 一卡二卡三卡视频| 国产精品麻豆久久| 色爱区成人综合网| 尤物tv在线精品| 国产成人精品免费视频大全最热| 国产成人久久精品麻豆二区| 欧美自拍视频在线观看| 里番在线播放| 久久亚洲影音av资源网 | 男人女人黄一级| 亚洲国产日韩欧美一区二区三区| 熟女熟妇伦久久影院毛片一区二区| 国内精品久久久久久久影视简单 | 婷婷在线视频| 亚洲色图狂野欧美| 婷婷久久久久久| 日韩精品一区二区三区视频在线观看| 波多野结衣电车| 色综合久久久久综合体桃花网| 亚洲精品在线观看av| 玉米视频成人免费看| 日本中文在线视频| 亚洲欧洲精品一区二区三区不卡| 91网站免费视频| 91在线视频在线| 色婷婷精品久久二区二区密| 粉嫩高潮美女一区二区三区| 国内精品国产三级国产aⅴ久| 久久精品72免费观看| 欧美三级午夜理伦三级富婆| 日韩av中文字幕一区二区 | 国产精品456| 91在线第一页| 国产精品一区免费视频| 亚洲欧美一区二区三区不卡| 国模娜娜一区二区三区| 成人性生交视频免费观看| 麻豆精品精品国产自在97香蕉| 成人性做爰aaa片免费看不忠| 欧美一级网站| 超碰av在线免费观看| 日本va欧美va精品| 亚洲午夜激情影院| 国产一区二区导航在线播放| 午夜诱惑痒痒网| 国产精品一卡二卡在线观看| 日本女人性视频| 成人国产一区二区三区精品| 久久人人妻人人人人妻性色av| 97se亚洲国产综合在线| 国产全是老熟女太爽了| 欧美激情综合五月色丁香小说| 蜜臀久久99精品久久久久久| 国产精品蜜臀在线观看| 成人免费毛片xxx| 亚洲电影中文字幕在线观看| 日韩网红少妇无码视频香港| 日韩欧美极品在线观看| 真实新婚偷拍xxxxx| 欧美精品丝袜中出| 黑人精品一区二区| 亚洲欧美综合区自拍另类| av在线1区2区| 色综合91久久精品中文字幕| yellow字幕网在线| 国产精品久久久久久久av电影| 亚洲18在线| 国产精品国产精品| 国产一区二区三区日韩精品 | 中文在线一区| 中文字幕永久视频| 国产精品123区| 精品少妇人妻一区二区黑料社区| 欧美激情在线观看视频免费| 亚洲成人生活片| 日韩欧美在线第一页| 亚洲系列第一页| 亚洲电影免费观看| 在线中文资源天堂| 久久久亚洲精选| 成人18视频在线观看| 国产精品久久波多野结衣| 不卡中文字幕| 国产 日韩 欧美在线| 毛片一区二区三区| 亚洲av网址在线| 亚洲男人天堂av| 欧美brazzers| 亚洲大尺度美女在线| 天堂中文а√在线| 57pao精品| 婷婷视频一区二区三区| 亚洲四区在线观看| 夫妻性生活毛片| 欧美性猛交xxxx黑人猛交| 国产手机精品视频| 亚洲最大在线视频| 国产精品xx| 亚洲一区二区三区四区视频| 国产精品一区二区av交换| 又大又硬又爽免费视频| 久久 天天综合| 受虐m奴xxx在线观看| 亚洲电影一级黄| 草草视频在线播放| 这里只有精品久久| 深夜成人福利| 蜜桃传媒视频第一区入口在线看| 欧美涩涩视频| 中文 日韩 欧美| 亚洲国产精品t66y| 中文字幕一区在线播放| 亚洲成人性视频| 午夜dj在线观看高清视频完整版 | 欧美成人精品在线观看| 黄色日韩网站| 亚欧精品在线| 肉肉av福利一精品导航| 男生裸体视频网站| 午夜精品免费在线| 成人免费一级视频| 欧美另类xxx| 九九99久久精品在免费线bt| 国产日韩视频在线播放| 九九国产精品视频| 农村老熟妇乱子伦视频| 欧美综合一区二区| a中文在线播放| 国产精品久久久久秋霞鲁丝 | 亚洲综合精品视频| 在线成人一区二区| 青青热久免费精品视频在线18| 精品视频第一区| 中文日韩欧美| 高潮毛片无遮挡| 在线日韩av片| 日本高清在线观看wwwww色| 国产一区二区丝袜| 婷婷色综合网| 日本r级电影在线观看| 亚洲欧美成aⅴ人在线观看| 99国产成人精品| 欧美大片网站在线观看| 成人搞黄视频| 成人免费在线小视频| 久久久久国产精品免费免费搜索| aaaaaa毛片| 中文字幕在线精品| 色悠久久久久综合先锋影音下载| 国产精品久久久久久久乖乖| 成人午夜视频福利| 中文字幕69页| xxxxx91麻豆| 亚洲不卡视频| 内射国产内射夫妻免费频道| 久久久久久久久一| 亚洲怡红院av| 欧美激情第6页| 色婷婷精品视频| 中文字幕亚洲乱码| 一区二区在线看| 日韩欧美在线观看一区二区| 国产精品7m视频| 欧美福利专区| 右手影院亚洲欧美| 欧美精品 国产精品| 好看的中文字幕在线播放| 久久精品五月婷婷| 久久精品国内一区二区三区| 免费在线观看黄色av| 日韩精品视频三区| 欧洲亚洲精品久久久久| 少妇人妻无码专区视频| 亚洲国产精品黑人久久久| jizz国产视频| 国产999精品| 欧美 日韩 国产一区二区在线视频 | 国产一区二区中文字幕| 日本亚洲欧美在线| 一区二区欧美久久| **爰片久久毛片| 美女一区二区三区视频| 亚洲一级二级在线| 成年人在线视频免费观看| 成人欧美一区二区三区视频| 日韩黄色片在线观看| 久久这里只有精品国产| 亚洲午夜性刺激影院| 伊人亚洲综合网| 国产99久久久国产精品| 西西44rtwww国产精品| 日韩在线免费av|