精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

OpenAI新研究補齊Transformer短板,將可預(yù)測序列長度提高30倍

開發(fā) 開發(fā)工具
近日,OpenAI研究人員開發(fā)出了一種深度神經(jīng)網(wǎng)絡(luò)Sparse Transformer,該網(wǎng)絡(luò)在預(yù)測長序列方面創(chuàng)造了新紀錄——無論預(yù)測的是文本、圖像還是聲音。

Transformer是一種強大的序列模型,但是它所需的時間和內(nèi)存會隨著序列長度出現(xiàn)二階增長。近日,OpenAI研究人員開發(fā)出了一種深度神經(jīng)網(wǎng)絡(luò)Sparse Transformer,該網(wǎng)絡(luò)在預(yù)測長序列方面創(chuàng)造了新紀錄——無論預(yù)測的是文本、圖像還是聲音。該神經(jīng)網(wǎng)絡(luò)利用注意力機制中的一種改進算法,可以從長度可能是之前30倍的序列中提取模式。

現(xiàn)在,AI 研究中的一項挑戰(zhàn)是在圖像、視頻或聲音等復(fù)雜數(shù)據(jù)中進行長序列的精細相關(guān)性建模。Sparse Transformer 合并了 O(N^2)Transformer 自注意力機制的 O(N√N) 重組以及其他一些改進,從而直接用于這些豐富的數(shù)據(jù)類型。以前,這些數(shù)據(jù)上所使用的模型是專為某個領(lǐng)域制作的,或者很難將序列擴展到包含幾千個元素。

相比之下,OpenAI 開發(fā)的模型通過使用數(shù)以百計的層可以對包含上萬個元素的序列進行建模,在諸多領(lǐng)域都取得了不錯的表現(xiàn)。OpenAI 研究人員利用該模型幫助創(chuàng)建能夠更好地理解世界的 AI 系統(tǒng)。

深度注意力

在 Transformer 中,每一個輸出元素與輸入元素相連接,同時根據(jù)具體情況對它們之間的權(quán)重進行動態(tài)計算,這一過程被稱為「注意力機制」。雖然人們相信這使得 Transformer 較那些具有固定連接模式的模型更為靈活,但實際操作中需要為每一層和注意力頭創(chuàng)建一個 N×N 注意力矩陣,當應(yīng)用于圖像或原始音頻等具有許多元素的數(shù)據(jù)類型時會消耗大量內(nèi)存。

當矩陣存儲在內(nèi)存或在逆推計算過程中進行再計算時,深度 Transformer(64 層和 4 個頭)的注意力內(nèi)存使用情況。作為參考,用于深度學(xué)習(xí)的標準 GPU 內(nèi)存通常是 12-32GB.

減少內(nèi)存消耗的一種方法是在反向傳播過程中從檢查點處重新計算注意力矩陣,這是深度學(xué)習(xí)中的一種成熟的方法,以更多的計算來減少內(nèi)存使用。

當 Transformer 中的注意力矩陣完成時,這意味著內(nèi)存消耗將不受層數(shù)的支配,使研究人員訓(xùn)練網(wǎng)絡(luò)的深度大大超過從前。在實際操作中,研究人員發(fā)現(xiàn)在處理 CIFAR-10 等基準測試任務(wù)時,深度達 128 層的 Transformer 表現(xiàn)出的性能優(yōu)于較淺的網(wǎng)絡(luò)。

為了訓(xùn)練深度更大的模型,研究人員對 transformer 的操作順序進行了幾次調(diào)整,修改了初始化方法。詳情參見論文。

稀疏注意力

然而,對于非常大的輸入來說,甚至計算單個注意力矩陣都是不現(xiàn)實的。因此,OpenAI 使用了稀疏注意力模式,在這種模式中,每個輸出位置僅從輸入位置子集中計算權(quán)重。當子集相對于整個輸入集較小時(如元素數(shù)量是√N 而不是 N),即使對于非常長的序列,注意力計算也會變得比較容易,算法復(fù)雜度為 O(N√N)而不是 O(N^2)。

為了評估該方法的可行性,人們首先可視化并學(xué)習(xí)了圖像上深度 Transformer 的注意力模式,發(fā)現(xiàn)其中許多模式表現(xiàn)出了可解釋和結(jié)構(gòu)化的稀疏模式。以下每幅圖像都顯示了哪個輸入像素(白色高亮標出)由一個給定的注意力頭處理,以預(yù)測圖像中的下一個值。當輸入部分集中在小的子集上并顯示出高度規(guī)律性時,該層就易于稀疏化。以下是 CIFAR-10 圖像上 128 層模型的樣本:

左:Layer 19,右:Layer 20。為一個 128 層的 CIFAR-10 網(wǎng)絡(luò)的若干層學(xué)習(xí)注意力模式(白色高亮顯示)。這些層學(xué)會了在兩個維度上分割注意力。Layer 19 匯總每一行的信息,Layer 20 按列匯總這些信息,從而有效分解了全注意力運算。

為獲取位置記憶而訓(xùn)練的層(左:Layer 6;右:Layer 36),它們通常關(guān)注類似的位置,不管輸入數(shù)據(jù)或時間步長如何(Layer 6)。其他層學(xué)習(xí)高度依賴數(shù)據(jù)的訪問模式(Layer 36)。

雖然許多層顯示出稀疏的結(jié)構(gòu),但有些層清晰地顯示出了動態(tài)注意力,這種注意力延伸到整個圖像。為了保持網(wǎng)絡(luò)學(xué)習(xí)這種模式的能力,研究人員實現(xiàn)了注意力矩陣的二維分解,其中網(wǎng)絡(luò)可以通過兩步稀疏注意力關(guān)注到所有位置。

 strided attention 大概等同于每個位置處理自己的行和列,它與以上網(wǎng)絡(luò)學(xué)得的注意力模式類似。(注意,列注意力可等同于處理轉(zhuǎn)置矩陣的行)。第二版 fixed attention 在列元素之后處理固定列和元素,研究者認為這個模式對于數(shù)據(jù)無法擬合二維結(jié)構(gòu)(如文本)的情況很有用。

實驗結(jié)果

Sparse Transformer 在 CIFAR-10、Enwik8 和 Imagenet 64 數(shù)據(jù)集上刷新了當前密度估計分數(shù)。

在 CIFAR-10、Enwik8 和 Imagenet 64 數(shù)據(jù)集上的密度估計性能(單位為 bits per byte/dim)。M 表示網(wǎng)絡(luò)中使用的參數(shù)(單位為百萬),W 表示網(wǎng)絡(luò)寬度,L 表示層數(shù),H 表示頭數(shù)。

研究者還發(fā)現(xiàn)稀疏注意力比完整注意力的損失更低,且速度更快。這可能指向稀疏模式產(chǎn)生的有用歸納偏置,或者密集注意力的底層優(yōu)化問題。

生成圖像

使用了稀疏注意力的 Transformer 似乎有一種全局結(jié)構(gòu)的概念,這可以通過觀察圖像補全(image completion)進行定性評估。下圖可視化了一個在 64×64 ImageNet 上訓(xùn)練的模型:

損壞原圖

損壞原圖

修復(fù)圖像

修復(fù)圖像

真實圖像

真實圖像

研究人員還生成了完全無條件的樣本,其中未調(diào)整的 softmax 溫度為 1.0。這些模型使用似然目標進行訓(xùn)練,其覆蓋了所有的數(shù)據(jù)模式(其中包括可能不存在的數(shù)據(jù)),而不是增強較小部分數(shù)據(jù)的保真度。從具有未調(diào)整溫度的模型中取樣,研究人員看到了該模型認為世界上存在的圖像的完整分布。因此,一些樣本看起來奇奇怪怪的。

模型示例

模型示例

生成原始音頻波形

通過簡單改變位置嵌入,稀疏 Transformer 還能用來生成原始音頻,而非圖像。隨著深度學(xué)習(xí)擴展到新的數(shù)據(jù)類型,用這類網(wǎng)絡(luò)來指定歸納偏置也很容易。

該模型是在原始的古典音樂片段上訓(xùn)練的,并使用了稀疏注意力來生成長度為 65000 的序列。這相當于大約 5 秒長的原始音頻,研究人員在下面的每個片段中將幾個樣本連接在一起。

代碼公布

通常,實現(xiàn)稀疏注意力需要將查詢和關(guān)鍵矩陣分割成塊,因此為了簡化實驗,OpenAI 實現(xiàn)了一組塊稀疏核,這些核在 GPU 上高效地執(zhí)行這些操作。OpenAI 開源了這些核并提供了稀疏注意力函數(shù)的示例:https://github.com/openai/sparse_attention

未來發(fā)展和限制

本文介紹的稀疏注意力模式只是對長序列進行高效建模的初步嘗試。研究人員認為,探索稀疏注意力的不同模式和各種組合非常有用,而且學(xué)習(xí)稀疏模式對下一代神經(jīng)網(wǎng)絡(luò)架構(gòu)來說也是一個很重要的研究途徑。

即使有了上述改進,自回歸序列生成對非常高分辨率圖像和音頻來說仍是不切實際的。但是,研究人員介紹的優(yōu)化注意力操作可能有用,將它與其它方法(如多尺度方法)結(jié)合,可以建模高維數(shù)據(jù)。

論文:Generating Long Sequences with Sparse Transformers

論文鏈接:https://d4mucfpksywv.cloudfront.net/Sparse_Transformer/sparse_transformers.pdf

摘要:Transformer 是一種強大的序列模型,但是它所需的時間和內(nèi)存會隨著序列長度出現(xiàn)二階增長。這篇論文介紹了注意力矩陣的稀疏因式分解,可以將其降低到 O(N√N)。該研究提出了 a)訓(xùn)練更深網(wǎng)絡(luò)的架構(gòu)和初始化變體;b)重新計算注意力矩陣以節(jié)省內(nèi)存;c)用于訓(xùn)練的快速注意力內(nèi)核。研究者將具備這些變化的網(wǎng)絡(luò)稱為 Sparse Transformer,并證明該網(wǎng)絡(luò)可以使用數(shù)百個層來建模成千上萬個時間步長的序列。

該網(wǎng)絡(luò)在從原始字節(jié)中建模圖像、音頻和文本時使用的是同樣的架構(gòu),在 Enwik8、CIFAR10 和 ImageNet-64 數(shù)據(jù)集上取得了當前密度估計性能。研究者生成的無條件樣本展示了全局一致性和極大的多樣性,并證明原則上可以使用自注意力建模長度超百萬的序列。

參考鏈接:https://openai.com/blog/sparse-transformer/

【本文是51CTO專欄機構(gòu)“機器之心”的原創(chuàng)譯文,微信公眾號“機器之心( id: almosthuman2014)”】 

戳這里,看該作者更多好文

 

責(zé)任編輯:趙寧寧 來源: 51CTO專欄
相關(guān)推薦

2024-02-26 00:20:00

AI模型

2024-12-02 11:00:00

模型架構(gòu)

2022-05-06 07:31:01

useEventReactHook

2023-03-16 18:09:00

機器學(xué)習(xí)數(shù)據(jù)集

2012-11-30 10:52:57

低功耗ARM軟件

2023-12-29 00:11:35

AI架構(gòu)OpenAI

2021-10-19 06:04:23

智能家居智能化物聯(lián)網(wǎng)

2025-08-25 08:50:00

AI模型OpenAI

2022-08-23 11:40:34

數(shù)據(jù)云計算安全

2020-04-28 18:47:06

微信微信群移動應(yīng)用

2024-01-30 01:12:37

自然語言時間序列預(yù)測Pytorch

2023-12-29 22:37:42

時間序列NLP

2023-07-09 15:21:05

AI模型LongNet

2023-10-09 09:35:34

自動駕駛模型

2018-09-13 10:42:00

工具代碼機器學(xué)習(xí)

2021-05-17 15:07:02

5G電力技術(shù)

2025-03-03 07:39:23

2022-03-22 14:09:34

汽車量子充電

2020-07-29 08:28:47

5G醫(yī)療技術(shù)
點贊
收藏

51CTO技術(shù)棧公眾號

伊人再见免费在线观看高清版 | 国产欧美精品一区| 欧美一级免费看| 久久精品三级视频| 亚洲日本视频在线| 欧美日韩精品二区| 伊人久久大香线蕉成人综合网| 国产福利视频导航| 亚洲资源av| 日韩专区中文字幕| 理论片大全免费理伦片| 日本少妇一区| 一级女性全黄久久生活片免费| 久久久久久艹| 国产精品无码久久av| 18成人免费观看视频| 一区二区三区回区在观看免费视频| 男女视频在线观看网站| 国产免费不卡| 亚洲一二三四在线| 一区二区91美女张开腿让人桶| 黄频在线免费观看| 久久er精品视频| 欧美在线xxx| 免费日韩在线视频| 欧美激情偷拍自拍| 日韩毛片在线观看| 极品白嫩少妇无套内谢| 粉嫩91精品久久久久久久99蜜桃| 午夜久久久久久| 一本—道久久a久久精品蜜桃| 欧美另类自拍| 99在线精品观看| 97av自拍| 国产精品久久久久久久一区二区| 久久这里只有| 国语自产在线不卡| 国内偷拍精品视频| 久久高清精品| 中文字幕日韩有码| b站大片免费直播| 日韩深夜福利| 亚洲电影中文字幕| 野战少妇38p| 亚洲精品午夜| 欧美一级一区二区| 欧美一级视频在线| 欧美风情在线视频| 欧美最猛性xxxxx直播| 波多野结衣乳巨码无在线| 色呦呦在线免费观看| 亚洲欧洲精品一区二区精品久久久 | 自拍视频一区二区三区| 黄色在线观看网| 2欧美一区二区三区在线观看视频| 高清视频一区二区三区| 亚洲国产精彩视频| 国产精品一区久久久久| **亚洲第一综合导航网站| 亚洲高清色综合| 国产又黄又大久久| 私拍精品福利视频在线一区| 国产综合成人久久大片91| 国产成人亚洲综合| 黄色片中文字幕| 国产视频一区欧美| 26uuu另类亚洲欧美日本一| 日本视频www| 日韩中文字幕观看| 欧美日本不卡| 久久人人看视频| 欧美一二三区视频| 视频一区中文字幕国产| 国产精品看片资源| 97免费观看视频| 国产乱理伦片在线观看夜一区| 亚洲综合中文字幕在线| 空姐吹箫视频大全| 91在线观看免费视频| 日本欧美精品久久久| 中文字幕日本在线| 一区二区在线免费观看| 欧美日韩成人免费视频| 欧美二三四区| 欧美老人xxxx18| 韩国三级在线看| 亚洲日产av中文字幕| 亚洲午夜小视频| 中文字幕亚洲欧美日韩| 亚洲激情精品| 国产精品日韩在线一区| 国产成人久久精品77777综合 | 无码日韩精品一区二区免费| 国产亚洲精品高潮| 欧美做爰爽爽爽爽爽爽| 一区二区久久| 国产综合在线观看视频| 亚洲精品一区二区三区区别| 久久久天堂av| 亚洲精品天堂成人片av在线播放| 伊伊综合在线| 欧美一区二区三区免费视频| 草草影院第一页| 欧美在线免费一级片| 日本在线精品视频| 精品人妻少妇嫩草av无码专区| 26uuu色噜噜精品一区| 国产精品jizz在线观看老狼| 亚洲天堂手机| 日韩精品一区在线观看| 中文字幕 自拍| 亚洲精品极品| 91视频国产精品| 黄色av网址在线免费观看| 亚洲精品国产第一综合99久久 | 精品国产免费一区二区三区| 香蕉视频免费在线播放| 黄色一区二区在线观看| 亚洲综合20p| 精品日产免费二区日产免费二区| 久久久久久久久久久免费精品| 久久这里只有精品9| 不卡在线视频中文字幕| 偷拍盗摄高潮叫床对白清晰| 国产精品极品美女在线观看| 精品国产伦一区二区三区观看方式| 五月婷婷六月香| 免费日韩精品中文字幕视频在线| 成人区精品一区二区| 免费黄色在线看| 在线免费观看视频一区| 亚洲最大的黄色网| 最新精品国产| 91免费国产网站| www.在线播放| 一本大道久久a久久精品综合| 成熟妇人a片免费看网站| 欧美ab在线视频| 成人免费视频97| 亚洲成人三级| 欧美日韩一区精品| 黄色国产在线播放| 三级久久三级久久| 欧美一区视久久| 午夜精品久久久久久久久久蜜桃| 日韩激情av在线免费观看| 国产精品自拍视频一区| 大桥未久av一区二区三区中文| 2021狠狠干| 国产专区精品| 欧美成人黑人xx视频免费观看| 国产一区二区小视频| 国产精品国产自产拍在线| 亚洲精品自拍网| 色999国产精品| 国产丝袜欧美中文另类| 亚洲男同1069视频| 伊人影院综合在线| 91影院成人| 91亚洲国产精品| 中文字幕伦理免费在线视频 | 欧美国产视频日韩| 高h放荡受浪受bl| 午夜精品久久久久久不卡8050| 少妇精品无码一区二区三区| 妖精视频成人观看www| 久久久一本精品99久久精品| 日韩a**中文字幕| 中文字幕亚洲欧美一区二区三区 | 日韩午夜在线播放| 免费在线黄色片| 成人高清免费观看| 国产精品欧美激情在线观看| 精品国产一区二区三区久久久樱花 | 日韩影院在线观看| 一区二区三区的久久的视频| 国产精一区二区| 欧美精品久久久久久久免费观看 | 亚洲一品av免费观看| 日本一区二区三区久久| 亚洲视频在线一区| 精品国产乱码久久久久夜深人妻| 99国产精品| 日本一区二区三不卡| 豆花视频一区| 午夜精品一区二区三区在线视 | 久久女同精品一区二区| 激情五月俺来也| 狠狠入ady亚洲精品经典电影| 欧美黑人3p| 色综合.com| 97精品欧美一区二区三区| 国产爆初菊在线观看免费视频网站| 91精品国产色综合久久| 国产精品一区二区6| 中文字幕一区二区三区乱码在线| 日本一级大毛片a一| 日韩电影在线一区二区三区| 少妇大叫太大太粗太爽了a片小说| 在线观看欧美理论a影院| 91嫩草在线视频| 性欧美1819sex性高清| 欧美成人精品在线观看| 国产在线视频网| 亚洲成人999| 亚洲在线免费观看视频| 午夜成人免费视频| 男人晚上看的视频| 91亚洲男人天堂| 午夜av中文字幕| 三级在线观看一区二区| 妞干网在线视频观看| 外国成人免费视频| 欧美12av| 成人线上播放| 91午夜在线播放| 电影一区电影二区| 欧美亚洲成人免费| 肉肉视频在线观看| 久久精品国产成人| 国产三区四区在线观看| 亚洲黄色www| 精品人妻无码一区二区| 欧美精品粉嫩高潮一区二区| 国产精品成人久久久| 欧美日韩亚洲系列| 精品视频久久久久| 亚洲视频精选在线| 天堂av免费在线| 亚洲国产高清不卡| 久久久久久久久久久国产精品| 不卡影院免费观看| 中文字幕一区二区三区人妻在线视频| 青草国产精品久久久久久| 人妻少妇被粗大爽9797pw| 国内精品嫩模av私拍在线观看| 亚洲蜜桃av| 欧美偷拍自拍| 日韩欧美在线电影| 九一亚洲精品| 欧美视频1区| 久久91成人| 日本一区二区久久精品| 国产成人精品免费视| 蜜桃导航-精品导航| 婷婷亚洲精品| 免费在线观看91| 欧美精品系列| 日韩欧美一区二区三区四区 | 日韩精品在线看| 手机av免费在线观看| 精品99久久久久久| 天堂av中文字幕| 日韩久久免费电影| 国产午夜视频在线观看| 色哟哟入口国产精品| 日本在线观看| 欧美伦理91i| a毛片不卡免费看片| 2019亚洲男人天堂| 日韩精品专区| 国产日韩欧美综合| 亚洲综合视频| 国产91精品入口17c| 精品三级av| 欧美三级华人主播| 日韩一区自拍| 特级西西444| 亚洲久久一区二区| 国产精品无码av无码| 蜜臀久久久99精品久久久久久| 天堂中文av在线| 国产成人午夜视频| 国产高清自拍视频| 国产日韩欧美精品综合| 男女性高潮免费网站| 亚洲一卡二卡三卡四卡五卡| 亚洲欧美自拍视频| 欧美人妖巨大在线| 亚洲卡一卡二卡三| 亚洲欧美国产视频| 日本a级在线| 欧美激情小视频| 成人动漫一区| 91免费福利视频| 亚洲精品**不卡在线播he| 亚洲 国产 欧美一区| 国产一区二区三区自拍| 99蜜桃臀久久久欧美精品网站| 久久超碰97中文字幕| 人妻无码中文久久久久专区| 国产精品免费人成网站| 国产精品18p| 欧美私人免费视频| 黄色片一区二区| 色偷偷av一区二区三区乱| 爱福利在线视频| 国产精品久久久久久久久久ktv| 日韩视频在线直播| 日本免费一区二区三区| 国产精品v日韩精品v欧美精品网站| 99久久久无码国产精品6| 国产原创一区二区三区| 日本高清www| 一区二区国产盗摄色噜噜| 在线视频精品免费| 亚洲高清一区二| 久草免费在线观看| 日韩美女毛茸茸| 高清一区二区三区| 亚洲欧洲日夜超级视频| 亚洲一区欧美激情| 欧美熟妇另类久久久久久多毛| 久久精品一二三| 日韩欧美不卡视频| 欧美成人性福生活免费看| 亚洲成a人v欧美综合天堂麻豆| 日韩av电影手机在线观看| 国产精品99久久免费观看| 在线一区高清| 视频一区视频二区中文字幕| 成人性生活免费看| 一区二区三区在线视频免费| 中文字幕第三页| 精品亚洲一区二区| √最新版天堂资源网在线| 91九色露脸| 婷婷丁香综合| 亚洲综合av在线播放| 国产视频在线观看一区二区三区| 久久狠狠高潮亚洲精品| 日韩免费在线观看| 黄色在线视频网站| 国产免费久久av| 精品午夜久久| 国产精品人人妻人人爽人人牛| 不卡av免费在线观看| 国产无套在线观看| 精品久久久久一区| www555久久| 国产乱码精品一区二区三区日韩精品 | 亚洲免费福利| 久久大片网站| 亚洲一区二区动漫| 99久久国产精| 欧美丝袜第一区| 男男激情在线| 国产97在线|亚洲| 精品国产91乱码一区二区三区四区| 91看片就是不一样| 国产女主播视频一区二区| 无码一区二区三区在线观看| 亚洲视频自拍偷拍| 国外成人福利视频| 中文字幕一区二区三区在线乱码 | 欧美一级片在线免费观看| 一区二区三区四区国产精品| 亚洲精品国产精品乱码不卡| 久久久久久18| 亚洲精品国产精品粉嫩| 999精品网站| 国产精品无人区| 国产视频在线观看免费| 欧美老少做受xxxx高潮| 精品国产导航| 黄色片久久久久| 中文字幕乱码亚洲精品一区| 91高潮大合集爽到抽搐| 欧美日韩国产成人在线| 欧美精品中文| 日韩欧美xxxx| 亚洲天堂福利av| 国产91久久久| 国产精彩精品视频| 91超碰成人| 青青草视频网站| 欧洲精品视频在线观看| 中文字幕有码在线观看| 精品无人乱码一区二区三区的优势| 久久欧美肥婆一二区| 日本视频在线免费| 欧美成人激情免费网| 校园春色亚洲色图| 男人日女人的bb| 久久婷婷国产综合精品青草| 一级黄色免费片| 91精品国产91久久久久久久久| 欧美日韩激情在线一区二区三区| 亚洲欧美一区二区三区不卡| 欧美午夜电影在线| 黄色av网站在线播放| 久久久久久精| 精品亚洲免费视频| 三级黄色在线视频| 日韩性xxxx爱| 亚洲精品aaaaa| 18禁一区二区三区| 欧美午夜电影网| 九九色在线视频| 亚洲资源在线网|