精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

單GPU訓練一天,Transformer在100位數字加法上就達能到99%準確率

發布于 2024-6-3 09:56
瀏覽
0收藏

自 2017 年被提出以來,Transformer 已成為 AI 大模型的主流架構,一直穩站 C 位。


但所有研究者都不得不承認的是,Transformer 在算數任務中表現非常糟糕,尤其是加法,這一缺陷在很大程度上源于 Transformer 無法跟蹤大范圍數字中每個數字的確切位置。


為了解決這個問題,來自馬里蘭大學、CMU 等機構的研究者向這一問題發起了挑戰,他們通過在每個數字中添加一個嵌入來解決這個問題,該嵌入編碼數字相對于開頭的位置。該研究發現,只用一天時間在單個 GPU 上訓練 20 位數字,就可以達到最新的性能水平,100 位數字加法問題高達 99% 的準確率。


單GPU訓練一天,Transformer在100位數字加法上就達能到99%準確率-AI.x社區


論文地址:https://arxiv.org/pdf/2405.17399

項目地址:https://github.com/mcleish7/arithmetic

標題:Transformers Can Do Arithmetic with the Right Embeddings


具體而言,研究者建議對數據表示進行一個簡單的修改,就能解決這個缺點。他們提出了 Abacus 嵌入用于編碼每個數字符號 token 范圍內的位置。將 Abacus 嵌入與標準位置嵌入結合使用后,該研究觀察到 Transformer 在算數任務上的準確率有顯著提高,以至于最多只訓練了 20 位數操作數的模型可以泛化到 120 位數操作數的問題。這一數字代表了 6 倍的 SOTA 泛化因子,而以前的最先進的泛化因子也只有 2.5 倍。據了解,這是迄今為止被證明的最長的學習加法序列。


此外,本文還研究了幾種其他方法來改善 transformer 在算術和泛化方面的性能,他們發現結合輸入注入(input injection),即在輸入層和每個解碼器層之間插入跳躍連接,可以在 Abacus 嵌入基線上減少 50% 的泛化誤差。本文還發現,與嵌入結合使用的 looped transformer 架構可以在加法問題上實現幾乎完美的泛化。


本文的貢獻可以總結如下:


  • 本文提出了一種新的位置嵌入,稱為 Abacus 嵌入,以更好地捕獲每個數字的重要性,從而實現近乎完美的分布內泛化;
  • 研究表明,當將 Abacus 嵌入與輸入注入和 looped transformer 相結合時,性能會進一步提高,分布外準確率從 92.9% 提高到 99.1%,與單獨使用標準架構的嵌入相比,誤差降低了 87%;
  • 研究者將這些發現擴展到更復雜的問題,包括乘法和排序,在這些領域也展現出了長度泛化。


實現加法的長度泛化


作者研究了一系列方法,旨在提高從頭開始訓練的語言模型在算術能力上的表現。他們主要關注兩個假設:1)數字內各個位數的位置信息正在丟失;2)循環可以提高 Transformer 架構在多步算術推理問題上的推理能力。在詳細描述每項改進之前,作者簡要討論了訓練和評估設置。


實驗設置


作者訓練了僅包含解碼器的因果語言模型來解決加法問題。


他們考慮了兩種標準 transformer 架構。首先,他們使用一個標準的自回歸 transformer 模型,多個解碼器層以前饋方式堆疊。其次,他們通過輸入注入(input injection)增強了這一標準 transformer 模型,即把嵌入的輸入添加到每個解碼器層的輸入中。作者在圖 20 中直觀地描述了這些架構。


單GPU訓練一天,Transformer在100位數字加法上就達能到99%準確率-AI.x社區


Abacus 嵌入幫助對齊數字


通過之前的研究和初步實驗,作者發現,即使輸入的數字是先顯示最不重要的數字,訓練數據是分層的、豐富的(幾百萬個例子),標準 transformer 也很難學習多位數加法。他們還觀察到,人類在進行長加法運算時,會先將數位相同的數字排列成列。因此,作者的第一個假設是,對于 transformer 來說,每個數字的數位并不容易表示,而且這個子問題比實際加法本身帶來的障礙更大。


為了解決 transformer 在表示位置信息方面的局限性,作者設計了一種特殊的位置嵌入,它可以編碼每個數字相對于當前數字起始位置的位置。作者將其稱之為 Abacus 嵌入。他們將相同的位置嵌入應用于所有具有相同數位的數字,從而提供一個顯式的信號,供模型用于對齊數字,如圖 2 所示。


單GPU訓練一天,Transformer在100位數字加法上就達能到99%準確率-AI.x社區


Abacus 嵌入解決加法問題


對于標準 transformer 架構,Abacus 嵌入可將泛化性能提高到 100 位及以上。在圖 3(左)中,作者強調了 Abacus 嵌入與標準 transformer 架構和嵌入相比,在進行加法運算時所具有的比較優勢,取三種模型在所有情況下的平均準確度。



單GPU訓練一天,Transformer在100位數字加法上就達能到99%準確率-AI.x社區


圖 1 還顯示了使用 FIRE 和 Abacus 訓練的標準 transformer 模型的準確度結果,這些模型經過了域內 (ID) 和域外 (OOD) 測試。


單GPU訓練一天,Transformer在100位數字加法上就達能到99%準確率-AI.x社區


Transformer 中的循環提高了性能


在解決位置嵌入問題后,接下來作者探討了循環架構能否進一步提高 transformer 執行多位數加法的能力。他們使用「循環塊(recurrent block)」一詞來指一組具有不同權重的解碼器層,而「循環(recurrence)」則指循環塊的重復次數。作者使用有效深度(effective depth)一詞來指 transformer 中使用的層數,無論其權重是否唯一。除非另有說明,否則他們使用的是最大循環架構,即只循環一個唯一層來達到有效深度。他們還采用了輸入注入、 殘差連接的方式,將輸入的副本傳播到網絡中的每一層。


循環的優勢


在圖 3(右)中,作者比較了使用 FIRE 和 NoPE 嵌入對操作數多達 40 位的加法進行訓練的所有架構變體。盡管參數數量僅相當于其他模型的 1/10,但可以看到,looped transformer(循環的、有輸入注入和漸進損失)在使用任何一種位置嵌入時都取得了最佳的分布外性能。在圖 8 中,作者展示了這一結果在多種訓練數據規模下的穩健性。


單GPU訓練一天,Transformer在100位數字加法上就達能到99%準確率-AI.x社區


對于循環模型,可以選擇在訓練時改變每次前向傳遞的循環次數。這往往會提高模型測試時對較難任務的泛化能力,這也被稱為漸進損失計算(progressive loss computation)。這個損失函數是兩個前向傳遞的損失值的凸組合,一個使用字面上的循環數(1 × 16 模型為 16),另一個使用隨機的較小循環數。


接下來,作者探討了在保持有效深度固定的同時改變循環塊大小的效果。他們將循環塊中的層數減半,循環次數增加一倍,從塊中有 16 層、循環次數只有一次(16 × 1,即標準 transformer)的模型,過渡到塊中只有一層、循環次數有 16 次(1 × 16)的模型。


通過圖 4 分析這些結果,作者發現在某些情況下,結合循環和 Abacus 嵌入可以進一步提高性能。具體來說,在 OOD 問題上,有兩個循環的模型(8 × 2)產生的誤差是純非循環模型(16 × 1)的一半,而在 100 + 的 OOD 問題上,其準確率也有所提高。


最后,在附錄 A.7.3 中,作者改變了模型的有效深度,以分析參數數量對這項任務的影響,包括 Abacus、FIRE 和 NoPE 嵌入。雖然圖 4 中的實驗是對不同深度的公平比較,但純粹的標準 transformer 模型比相應的循環模型擁有更多的參數。在附錄的表 3 中,作者記錄了最接近百萬的參數量。


單GPU訓練一天,Transformer在100位數字加法上就達能到99%準確率-AI.x社區


單GPU訓練一天,Transformer在100位數字加法上就達能到99%準確率-AI.x社區


實驗


研究者不僅對加法問題進行了探討,還對乘法和排序進行了研究。


整數乘法


圖 5 展示了 Abacus 嵌入模型在 15 位數乘法的分布內準確率超過了之前的工作,且不需要用零將每個操作數填充到相同長度。特別地,該研究強調,與僅使用 FIRE 的基線相比,將 Abacus 嵌入與 FIRE 相結合也提高了分布問題中最難的分布準確率 (右下)。


單GPU訓練一天,Transformer在100位數字加法上就達能到99%準確率-AI.x社區


數組排序


表 1 展示了使用不同嵌入 ——FIRE、Abacus 及其組合 —— 訓練的標準 transformer(八層)的性能。結果顯示,組合嵌入方法增強了模型的泛化能力。


單GPU訓練一天,Transformer在100位數字加法上就達能到99%準確率-AI.x社區


如表 2 所示,研究者觀察到在將 Abacus+FIRE 嵌入組合與不同的模型架構(有效深度為 8)配對時,結果表現出混合性。


單GPU訓練一天,Transformer在100位數字加法上就達能到99%準確率-AI.x社區


Abacus 和相關嵌入


圖 6 展示了將 Abacus 嵌入整合到更通用系統中的真正潛力,顯示出 Abacus 嵌入與 FIRE 結合可以解鎖遠超 FIRE 嵌入解決問題的能力。 


單GPU訓練一天,Transformer在100位數字加法上就達能到99%準確率-AI.x社區


更多研究細節,請參考原論文。


本文轉自 機器之心 ,作者:機器之心


原文鏈接:??https://mp.weixin.qq.com/s/zHx_pMk6sHmIm-AJCS_sRA??

標簽
收藏
回復
舉報
回復
相關推薦
精品性高朝久久久久久久| 一级做a爱片久久| 国产精品jizz在线观看麻豆| 国产精品夜夜夜爽阿娇| 国产精品成人3p一区二区三区| 国产精品乡下勾搭老头1| 久久视频在线视频| 欧产日产国产精品98| 精品福利在线| 亚洲v中文字幕| 亚洲精品一区二区三| 成人毛片在线免费观看| 日韩国产成人精品| 久久久久久久久亚洲| 国产7777777| 天堂av一区二区三区在线播放 | 免费国产在线精品一区二区三区| 亚洲av无码一区二区三区在线| 精品免费av在线| 亚洲一区二区在线观看视频| 欧美日韩精品一区| www.超碰在线.com| 美女视频一区二区| 欧美在线播放视频| 国产第一页第二页| 99精品一区| 亚洲色图综合网| 日韩精品人妻中文字幕有码| 国内精品视频| 欧美日韩成人在线一区| 欧美牲交a欧美牲交aⅴ免费真| 青青草在线播放| 国产一区亚洲一区| 国产精品美女视频网站| 日韩在线播放中文字幕| 一区视频在线看| 九九热99久久久国产盗摄| 奇米网一区二区| 国产成人一区二区三区影院| 亚洲精品成人免费| 亚洲精品久久一区二区三区777 | 欧美一级片一区| 免费在线观看亚洲| 女生裸体视频一区二区三区| 波霸ol色综合久久| 熟女少妇内射日韩亚洲| 亚洲另类春色校园小说| 日韩二区三区在线| 一级国产黄色片| 免费观看成人www动漫视频| 精品福利视频一区二区三区| 亚洲性图第一页| 日本伊人久久| 日韩精品一区在线观看| 无码人妻丰满熟妇区毛片蜜桃精品 | 国产极品嫩模在线观看91精品| 国产不卡一区视频| 91久久偷偷做嫩草影院| 亚洲第一页在线观看| 成人一区二区三区中文字幕| 国产精品久久久一区二区三区| 中文字幕免费观看| 日韩av高清在线观看| 日韩美女在线观看一区| 亚洲天堂五月天| 美女尤物国产一区| 成人精品一区二区三区| 国产成人精品白浆久久69| 国产99久久久国产精品 | 伊人久久精品| 在线成人午夜影院| 涩多多在线观看| 欧美欧美在线| 亚洲级视频在线观看免费1级| 中文字幕22页| 国内不卡的一区二区三区中文字幕 | 色一情一乱一伦一区二区三区丨 | 日本在线视频中文字幕| 99香蕉国产精品偷在线观看 | 丝瓜av网站精品一区二区 | 欧美精品一区二区三区视频| www日本在线观看| 竹菊久久久久久久| 日韩中文在线观看| 国产精品18p| 久久精品欧洲| 91丨九色丨国产在线| 少妇高潮久久久| 国产欧美1区2区3区| 特级西西444| 色偷偷色偷偷色偷偷在线视频| 亚洲一卡二卡三卡四卡无卡久久 | 国产一线在线观看| 亚洲区小说区图片区qvod按摩| 欧美一级欧美一级在线播放| 白嫩情侣偷拍呻吟刺激| 成人在线一区| 亚洲 日韩 国产第一| 中文字幕+乱码+中文字幕明步 | 亚洲欧美国产中文| 999久久精品| 国产一区二区三区免费视频| 午夜爱爱毛片xxxx视频免费看| 久久人人99| 久久免费在线观看| 波多野结衣网站| 国产成人精品午夜视频免费| 日本一区二区三区四区高清视频 | 成人黄色av网址| 一本色道久久88综合日韩精品 | 国产精品美女久久久久久久网站| 久久综合一区| 国产精品成人无码免费| www.亚洲.com| 亚洲一区视频在线观看视频| 国产精品爽爽ⅴa在线观看| 国产日韩欧美视频在线观看| 久久久777精品电影网影网 | 久久久久久久久久亚洲| 伊人成人在线观看| 久久影院午夜片一区| 青草视频在线观看视频| 欧美另类激情| 国产一区二区日韩精品欧美精品| 国产又黄又粗视频| 在线观看日韩av电影| 亚洲xxxxx性| 色网站在线看| 欧美最猛性xxxxx直播| 亚洲观看黄色网| 国产精品国码视频| 亚洲一区二区免费| 日本激情视频在线观看| 欧美三电影在线| 亚洲高潮女人毛茸茸| 久久精品亚洲| 蜜桃久久精品乱码一区二区| heyzo一区| 日韩午夜激情免费电影| 国产美女网站视频| 奇米一区二区三区| 先锋影音网一区| 欧美色网在线| 中文字幕亚洲情99在线| 中文字字幕在线观看| 国产欧美日韩在线观看| 日韩欧美黄色大片| 欧洲grand老妇人| 国产精品狼人色视频一区| 国产小视频福利在线| 日本高清成人免费播放| 亚洲理论片在线观看| 久久久青草婷婷精品综合日韩| 国产区亚洲区欧美区| 久草在现在线| 在线观看视频一区| 一级片久久久久| 精品一区二区在线视频| 三级网在线观看| 午夜电影一区| 97在线视频国产| 九色网友自拍视频手机在线| 91福利国产成人精品照片| 夜夜春很很躁夜夜躁| 精品一区二区三区久久| 法国空姐在线观看免费| 亚洲综合网狠久久| 2020欧美日韩在线视频| 免费一级毛片在线观看| 欧美日韩国产在线播放网站| 国产中文av在线| 国产91高潮流白浆在线麻豆| 日韩欧美国产免费| 日韩欧美精品一区| 91精品国产一区二区三区动漫| 国产黄在线观看| 91精品黄色片免费大全| 久久精品波多野结衣| 99视频有精品| 欧美特级aaa| 欧美激情 亚洲a∨综合| 久久精品一二三区| 成人激情视屏| 久久久免费观看视频| 久久手机免费观看| 91精品麻豆日日躁夜夜躁| 国产污污视频在线观看| 中文字幕av一区二区三区免费看| 爱福利视频一区二区| 日韩在线第七页| 国产另类第一区| 日本一区二区三区中文字幕| 久久久久久国产精品久久| 毛片在线播放网站| 日韩视频一区在线观看| 亚洲第一网站在线观看| 亚洲激情av在线| 国产精品天天干| 国产aⅴ综合色| 国产精品久久a| 国产亚洲毛片| 91免费版看片| 精品免费在线| 国产精品区一区二区三在线播放 | 波多野结衣在线观看一区二区三区| 国内精品久久久久久久| 国家队第一季免费高清在线观看| 色婷婷综合久久| 久久久久久免费观看| 国产亚洲精品久| 久久久久成人精品无码中文字幕| 国产视频久久| 91成人综合网| 国产精品久久久久蜜臀| 日韩国产精品一区二区| 18国产精品| 亚洲一区二区在线| 美女视频一区| 国产福利精品视频| 午夜影视一区二区三区| 欧美夫妻性视频| 中文字幕中文字幕在线中高清免费版| 欧美成人bangbros| 国产精品九九九九| 日韩欧美极品在线观看| 日韩精品一区二区三| 亚洲精品成a人| 中日韩一级黄色片| 国产精品狼人久久影院观看方式| 日韩精品――色哟哟| 另类小说欧美激情| 蜜臀av午夜一区二区三区| 亚洲视频观看| 亚洲熟妇无码av在线播放| 综合天堂av久久久久久久| 午夜免费电影一区在线观看| 精品一区二区三区中文字幕老牛| 国产欧美一区二区三区久久人妖| 毛片免费在线| 日韩风俗一区 二区| 特级丰满少妇一级aaaa爱毛片| 一本到不卡精品视频在线观看| 少妇视频在线播放| 久久亚区不卡日本| 国产成人无码一区二区在线观看| 免费国产亚洲视频| 天堂av在线网站| 蜜桃久久久久久| 一区二区三区视频在线观看免费| 国产精品www.| 国内少妇毛片视频| 极品av少妇一区二区| 欧美亚洲日本一区二区三区| 99xxxx成人网| 中国丰满人妻videoshd| 丝袜诱惑亚洲看片| 在线观看国产福利| 国产精品一区二区在线播放 | 天天免费亚洲黑人免费| 热99在线视频| av成人在线播放| 91在线|亚洲| 国产精品欧美大片| 麻豆成人av| 97视频精品| 日韩极品视频在线观看| 亚洲最黄网站| 亚洲精品高清无码视频| 国产一区二区电影| 亚洲欧美日韩偷拍| 99国产精品国产精品久久| 免费看黄色的视频| 日韩一区有码在线| 日本三级片在线观看| 91国偷自产一区二区开放时间| 四虎永久在线精品| 欧美在线999| 国产丝袜视频在线观看| 亚洲国产精久久久久久| 免费观看成年在线视频网站| 日韩在线播放视频| 欧美wwww| 国产成人亚洲精品| 国产激情一区| 蜜桃传媒一区二区| 一区二区三区在线观看免费| 欧美日韩成人免费视频| 青草av.久久免费一区| 99久久久无码国产精品性波多| 国产一区二区精品在线观看| 97人妻精品一区二区三区免| 国产精品免费视频观看| 日韩精品成人在线| 91精品视频网| 手机福利在线| 欧美精品在线免费观看| 欧美日韩大片| 国产精品xxxx| 99国产**精品****| 97在线播放视频| 成人黄色a**站在线观看| 日韩影视一区二区三区| 亚洲午夜精品网| 亚洲一区 中文字幕| 精品亚洲一区二区三区在线播放| 日韩国产福利| 精品少妇v888av| 久久人体av| 久久人人九九| 激情欧美一区| 免费人成视频在线播放| 国产精品私房写真福利视频| 日本在线免费观看| 日韩免费观看高清完整版| 秋霞午夜在线观看| 日本久久亚洲电影| 理论片一区二区在线| 粉嫩av一区二区三区天美传媒 | 久久久免费视频网站| 激情综合色综合久久综合| 亚洲人成人无码网www国产| 五月天精品一区二区三区| 精品久久无码中文字幕| 久久精品中文字幕电影| 日韩一级二级| 欧美动漫一区二区| 在线视频日韩| 日韩Av无码精品| 亚洲国产综合视频在线观看| 国产乱码精品一区二三区蜜臂| 欧美成人性福生活免费看| 米奇777四色精品人人爽| 国产精品一区二区久久久| 免费一区二区三区视频导航| 97视频在线免费| 成人福利视频网站| 久青草视频在线观看| 日韩限制级电影在线观看| 一区二区三区伦理| 亚洲一区二区三区视频| 91精品综合久久久久久久久久久| 国产日本在线播放| 国产91精品一区二区麻豆亚洲| 一级欧美一级日韩片| 亚洲网友自拍偷拍| 人妻无码一区二区三区久久99| 亚洲图片在线综合| 欧美福利在线播放| 日本不卡免费新一二三区| 视频在线观看91| 97伦伦午夜电影理伦片| 黑人极品videos精品欧美裸| 日韩国产福利| 国产成一区二区| 日本一本不卡| 亚洲高清视频免费| 亚洲永久精品国产| 手机看片1024国产| 日韩男女性生活视频| 波多野结衣在线观看一区二区三区| 欧美不卡在线播放| av一二三不卡影片| 日本成人一级片| 菠萝蜜影院一区二区免费| 91麻豆精品激情在线观看最新 | 亚洲清纯自拍| www.久久av| 欧美日韩你懂得| 超碰在线无需免费| 国产综合动作在线观看| 久久久久久穴| 小早川怜子一区二区的演员表| 欧美性生交大片免费| jizzjizz在线观看| 99电影在线观看| 亚洲免费婷婷| 婷婷国产成人精品视频| 精品三级av在线| 神马久久资源| 17c丨国产丨精品视频| 337p粉嫩大胆噜噜噜噜噜91av| 青青青在线免费观看| 精品国产一区二区国模嫣然| 国产精欧美一区二区三区蓝颜男同| 国产亚洲二区| 久久成人一区| 国产精品三区在线观看| 日韩精品中文在线观看| crdy在线观看欧美| 国产91在线视频观看| 自拍偷拍亚洲激情| 亚洲av片一区二区三区| 国产精品永久免费视频| 亚洲日本欧美| 成人自拍小视频| 亚洲老头同性xxxxx| 欧美欧美在线| 一本色道久久亚洲综合精品蜜桃| 国产日韩在线不卡| 亚洲第一页视频|