精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

?GPT-3好“搭檔”:這種方法緩解模型退化,讓輸出更自然

人工智能 新聞
近日,來自劍橋大學、香港中文大學、騰訊 AI 實驗室和 DeepMind 的科學家們證明,自然語言生成模型出現退化現象的一個潛在原因是 token 的分布式表示向量存在各向異性。

文本生成對于許多自然語言處理應用來說都是非常重要的。

但神經語言模型的基于最大化的解碼方法(如 beam search)往往導致退化解,即生成的文本是不自然的,并且常常包含不必要的重復。現有的方法通過采樣或修改訓練目標來引入隨機性,以降低某些 token 的概率(例如,非似然訓練)。然而,它們往往導致解決方案缺乏連貫性。

近日,來自劍橋大學、香港中文大學、騰訊 AI 實驗室和 DeepMind 的科學家們證明,自然語言生成模型出現退化現象的一個潛在原因是 token 的分布式表示向量存在各向異性。

他們進一步提出了一個基于對比學習的自然語言生成框架。在兩種語言的三個基準測試上進行的大量實驗和分析表明,該方法在人工評估和自動評估兩個方面上優于目前最先進的文本生成方法。

研究動機與主要研究內容

圖1. Token 表示向量的 cosine 相似度矩陣

這項研究中,研究團隊發現,神經語言模型的退化源于 token 表示向量的各向異性分布,即它們的表示向量駐留在整個空間的一個狹窄子集中。

圖1(a)展示了 token 表示向量的 cosine 相似度矩陣,其中表示向量來源于 GPT-2 的最后一個隱層的輸出。研究團隊看到句子中 token 之間的余弦相似度超過 0.95,這意味著這些表征彼此十分接近。

在理想情況下,模型的 token 表示應遵循各向同性分布,即 token 相似度矩陣應是稀疏的,不同 token 的表示應是有區別的,如圖2(b)所示。在解碼過程中,為了避免模型退化,需要保留生成文本的 token 相似矩陣的稀疏性。

基于上述動機,研究團隊提出了 SimCTG(一個簡單的神經文本生成對比框架),該框架鼓勵模型學習有區分度的、各向同性的 token 表示。

對比搜索背后的關鍵直覺是:

(1)在每個解碼步驟,輸出應該從組中選擇最有可能的候選詞的預測模型,以更好地維護生成的文本之間的語義一致性;

(2)token 相似矩陣的稀疏性應該保持以避免退化。

主要方法

  • 對比訓練

研究團隊的目標是鼓勵語言模型學習有區別且各向同性的 token 表示。為此,在語言模型的訓練中引入了一個對比損失函數 LCL。給定任意一個變長序列 x,該對比損失函數定義為:

其中,ρ 是預先設定的 margin,hxi 是模型輸出的 xi 的表示向量。相似度函數 s 計算任意兩個表示向量之間的余弦相似度:

可以想象,通過訓練上述對比損失函數,不同 token 的表示間的距離將被拉開。因此,可以得到一個可分的、各向同性的模型表示空間。最終的總損失函數為:

  • 對比搜索

研究團隊提出一種新的解碼方法:對比搜索(contrastive search)。每一步解碼時,(1)模型從最可能的候選集合中選出一個作為輸出,(2)產生的輸出應當與前面已經生成的內容足夠不同。這種方式下生成的文本在保持與前文的語義一致性的同時還能避免模型退化。具體來說,輸出 xt 的生成滿足:

其中 V(k) 是候選詞集合,k 通常取 3 到 10。上式的第一項代表模型對 v 的支持度 v(model confidence),是模型估計的候選詞 v 為下一個詞的概率。第二項是對模型退化的懲罰項(degeneration penalty)是下一個詞 v 與前面已生成的詞的相似度最大值。α 是超參數,負責調節兩項損失之間的平衡。當 α=0 時,解碼方法退化到貪婪搜索。

效率分析:該方法可以有效地實現對比搜索。所需的額外計算是退化罰的計算,該計算可以通過簡單的矩陣乘法來實現。后文將證明,對比搜索的譯碼速度優于或可與其他廣泛應用的譯碼方法相媲美。

文本生成

首先在開放式文本生成任務(open-ended document generation)上評價研究團隊所提出的新方法。

模型和基線 本文提出的方法與模型結構無關,因此可以應用于任何生成模型。在這項實驗中,他們在具有代表性的 GPT-2 模型上評估了所提出的方法。

具體來說,研究團隊在評估基準(詳細如下)上使用提出的目標 LSimCTG 對 GPT-2 進行了調優,并使用不同的解碼方法生成連續文本。使用基礎模型(117 M 參數)進行實驗,該模型由 12 個 Transformer 層和 12 個 attention head 組成,將本方法與兩個強基線方法進行比較:

(1)GPT-2 在標準 MLE 損失函數上微調;(2)利用非似然目標函數微調。研究團隊的實現基于 Huggingface 庫(Wolf 等人,2019)。

基準數據集 研究團隊在 Wikitext-103 數據集(Merity 等人, 2017)上進行了實驗,該數據集包含了一個包含超過 1 億單詞。Wikitext-103 是一個文檔級數據集,已被廣泛用于大規模語言建模的評估。

評價指標

研究團隊從兩個方面進行評價:

(1)語言建模質量,衡量模型的內在質量;

(2)生成質量,用來衡量生成文本的質量。

l 語言建模質量

n 困惑度

n 預測準確率

n 預測重復率

l 文本生成質量

n 生成重復度

n 多樣性

nMAUVE(一種度量機器生成文本與人類生成文本間相近程度的指標;MAUVE 越高,機器文本越像人類文本)

n 語義連貫性

n 生成文本的困惑度

實驗結果

表1. 多種方法在 Wikitext-103 數據集上的測試結果

表1 展示了 Wikitext-103 數據集上的實驗結果。

語言建模質量 從結果來看,SimCTG 獲得了最好的困惑度和下一個 token 預測準確率。因為其使用了更有區分度的分布式表示,SimCTG 在進行下一個 token 預測時更不容易混淆,從而提高了模型性能。在 rep 和 wrep 度量上,非似然模型產生了最好的結果,但代價是復雜性和下一個 token 預測準確性方面的性能下降。

文本生成質量

首先,在 rep-n 和多樣性指標上,SimCTG+對比搜索獲得了最好的性能,表明它最好地解決了模型退化問題。其次,MAUVE 分數表明 SimCTG+對比搜索生成的文本在令牌分布方面與人類編寫的文本最接近。第三,在所有方法中,SimCTG+對比搜索是唯一一種一致性得分在 0.6 以上的方法,表明該方法生成的文本質量高,且相對于前綴而言語義一致。最后,gen-ppl 度量也驗證了 SimCTG+對比搜索的優越性,因為與其他方法相比,它獲得了明顯更好的生成困惑度。

此外,從 MLE 和 Unlikelihood 基線的結果來看,對比搜索仍然比貪婪搜索和 beam 搜索帶來了額外的性能提升。然而,對比訓練的性能提高仍然滯后于 SimCTG,這說明了對比訓練的必要性。一個可能的原因是,沒有對比損失 LCL,MLE 或 unlikelihood 訓練出來的 token 表示不具備充分的可區分性。因此,不同候選對象的退化懲罰不易區分,輸出的選擇受模型置信度的影響,使得對比搜索的有效性降低。

人工評價

研究團隊還通過內部評分平臺,在高英語水平學生的幫助下進行了人工評價。所有生成文本和真實的后文放在一起隨機打亂,然后由 5 個人類評分者評估,最終產生總共 9000 個標注樣本。評估遵循李克特 5 點量表(1、2、3、4 或 5),從以下三個方面進行打分:

  • 連貫性:生成的文本是否與前文在語義上保持一致
  • 流暢性:生成的文本是否易讀
  • 信息量:生成的文本是否多樣,是否包含有趣的內容

表2. 文本生成的人工評價

表2 給出了人工評價結果,其中第一行顯說明了人類評價能夠很好的發現參考文本。首先,研究團隊發現直接使用 MLE 或 Unlikelihood 模型進行對比搜索并不能得到滿意的結果。這是由于它們表示空間的各向異性。第二,Unlikelihood 模型的一致性得分明顯低于 MLE 和 SimCTG,表明其產生的結果最不可能,這從表1 的 generation perplexity(gen-ppl)中也可以看出。此外,SimCTG +對比搜索結果在一致性和流暢性方面明顯優于不同模型的核抽樣。

最后,SimCTG-large +對比搜索獲得了全面的最佳性能,甚至在流暢度指標上與人類書寫的文本表現相當。這揭示了該方法對于大型模型的通用性,未來的工作可以集中于將其擴展到包含超過數十億參數的模型,如 GPT-3。

開放式對話系統

為了測試這個方法在不同任務和語言中的通用性,本文還在開放域對話生成任務中評估了研方法。在這個任務中,給定一個多回合對話上下文(每個回合都是一個用戶的話語),要求模型生成一個語義上與上下文一致的適當的響應。在這里,對話語境被視為前文。

基線模型和基準測試集 研究在中文和英文兩種語言的兩個基準數據集上進行了實驗。中國數據集方面,使用 LCCC 數據集(Wang 等人,2020)。英語數據集方面,則使用 DailyDialog 數據集。

研究團隊比較了通過 SimCTG 和 MLE 微調的 GPT-2 模型。具體來說,對于中文基準數據集,使用了一個公開可用的中文 GPT-2(Zhao 等人,2019)。在訓練期間,使用 128 作為 batch size,并將訓練樣本截斷為最大長度 256 個 token。在 LCCC 數據集上,對模型進行 40k 步的訓練(即微調)。對于 DailyDialog 數據集,由于其數據集較小,將模型訓練 5k 步。優化方面,使用 Adam 優化器和 2e-5 的學習率。

模型評價 研究團隊依靠人工評價來衡量模型的性能,從測試集中隨機選取了 200 個對話上下文,請 5 位標注者從三個維度:連貫性、流暢性和(3)信息量,分別進行打分。分數遵循李克特 5 分量表(1、2、3、4 或 5)。

表3. 開放式對話的人工評價

表3 展示了開放式對話的人工評價結果。在這兩個數據集上, SimCTG +對比搜索在各種指標上顯著優于其他方法,這表明該方法可推廣到不同的語言和任務上。值得強調的是,在 LCCC 基準測試中,SimCTG +對比搜索在流暢度指標上的表現出人意料地優于人類,而在連貫性和信息量指標上的表現也相當不錯。

并且,即使不進行對比訓練,MLE 模型在使用對比搜索時的性能也顯著提高。這是由于漢語語言模型的固有屬性,MLE 目標已經可以產生一個表現出高度各向同性的表示空間,使得對比搜索可以直接應用。這一發現尤其具有吸引力,因為它揭示了對比搜索在現成語言模型(即不進行對比訓練)上的潛在適用性,適用于某些語言,如漢語。     

總結

這項研究中,作者們證明了神經語言模型的退化源于它們的 token 表示的各向異性性質,并提出了一種新的方法——SimCTG,用于訓練語言模型,使其獲得一個各向同性且有區分度的表示空間。此外,研究還介紹了一種新的解碼方法——對比搜索,該方法與本文所提出的 SimCTG 目標一致。基于在兩種語言的三個基準測試集上進行的廣泛實驗和分析,自動和人工評價都表明了,本文所提的方法大大削弱了模型退化程度,顯著優于當前最先進的文本生成方法。

責任編輯:張燕妮 來源: 數據實戰派
相關推薦

2021-10-28 09:19:29

模型人工智能Facebook

2021-03-23 15:21:00

人工智能機器學習技術

2022-11-21 09:34:33

AI模型

2023-03-09 08:15:56

GPT-3系統數據

2023-03-01 16:15:16

2023-04-07 09:53:02

量子AI

2022-03-24 10:35:38

人工智能模型代碼

2021-07-19 10:56:36

GPE-3OpenAI微軟

2023-02-14 08:00:00

人工智能GPT-3語言模型

2022-04-20 10:47:46

AIGPT-4

2017-04-28 15:07:10

網絡瓶頸問題

2023-06-08 15:33:31

人工智能GPT-3

2021-05-31 15:16:28

編程技能開發

2023-09-13 09:17:00

模型訓練

2022-05-05 09:00:00

AI模型數據

2021-08-12 16:27:04

模型人工智能深度學習

2021-12-10 15:46:18

谷歌模型人工智能

2025-08-29 05:00:00

2020-08-21 13:22:12

GPT-3AI機器

2020-08-23 08:57:55

編碼GPT-3開發
點贊
收藏

51CTO技術棧公眾號

中文字幕超碰在线| 黄色免费福利视频| 99久久国产热无码精品免费| 欧美a级在线| 欧美日韩一区视频| 免费观看成人在线| 亚洲天堂久久久久| 亚洲小说区图片区| 日韩亚洲欧美在线观看| 欧美日韩一道本| www 日韩| 日韩av中文在线观看| www.亚洲免费视频| 潘金莲激情呻吟欲求不满视频| 日本天堂影院在线视频| 精一区二区三区| 国内精品久久久久影院 日本资源| 国产高潮视频在线观看| 精品日韩视频| 国产精品乱人伦中文| 高清一区二区三区视频| wwwwww在线观看| 精品福利av| 色综合影院在线| 欧美一级片黄色| 欧美裸体视频| 久久久亚洲国产美女国产盗摄| 91精品国产91| 国产成人av免费在线观看| 91精品视频一区二区| 欧美日韩亚洲一区二区| 国产一区再线| 国产人妻精品一区二区三区| 欧美黄色一级视频| 中文字幕日韩欧美精品在线观看| 亚洲成色www.777999| 思思99re6国产在线播放| 久久精品国产在热久久| 欧美亚洲国产精品| 久久久久久久久久网站| 成人在线免费视频观看| 日韩精品中文字| 黑人玩弄人妻一区二区三区| 亚洲欧美专区| 欧美日韩一区二区三区高清| 91看片就是不一样| 三级在线看中文字幕完整版| 国产欧美中文在线| 亚洲一区亚洲二区| 一级黄色短视频| 日韩vs国产vs欧美| 国产成人免费91av在线| 欧美一级特黄视频| 国产欧美日本| 国内精品视频久久| 国产网友自拍视频| 成人精品电影| 亚洲天堂2020| 精品人妻一区二区乱码| 日韩国产一二三区| 黄色精品一区二区| 91免费黄视频| segui88久久综合9999| 亚洲一区免费观看| 久久久性生活视频| 青青青青在线| 国产精品第五页| 国内精品视频免费| 香蕉视频免费看| 97精品久久久久中文字幕| 国产日韩换脸av一区在线观看| 少妇太紧太爽又黄又硬又爽| 国产视频一区欧美| 欧美成人免费播放| 成人免费看片98| 欧美国产一级| 久久精品在线视频| 久久久国产精品黄毛片| 日韩欧美一区二区三区在线视频| 精品处破学生在线二十三| 在线观看成人动漫| 蜜桃成人av| 色小说视频一区| 黄色片子在线观看| 日韩欧美视频| 欧美成人午夜激情视频| 亚洲毛片亚洲毛片亚洲毛片| 91一区二区| 国产小视频国产精品| 欧美一级特黄高清视频| 国产毛片一区二区三区| 日韩视频精品在线| 久久精品视频日本| 久久最新视频| 亚洲在线免费观看| 国产毛片毛片毛片毛片| 美国毛片一区二区| av蓝导航精品导航| 噜噜噜在线观看播放视频| 国产精品美日韩| 先锋在线资源一区二区三区| 欧美黄色小说| ...xxx性欧美| 精品少妇一区二区三区在线| √最新版天堂资源网在线| 亚洲综合一区二区三区| www黄色av| 国产精品欧美一区二区三区不卡| 精品久久五月天| 中国毛片在线观看| 亚洲欧美一级二级三级| 日韩免费在线看| 精品国产av一区二区三区| 国产精品白丝av| 欧美日韩电影一区二区三区| 日本天堂影院在线视频| 亚洲激情在线播放| 男女无套免费视频网站动漫| 99a精品视频在线观看| 色一区av在线| 精品国产一区二区三区四| 极品美女销魂一区二区三区 | 好看的中文字幕在线播放| 91久久免费观看| 蜜桃色一区二区三区| 日韩伦理视频| 久久亚洲电影天堂| www.欧美色| 成人免费福利片| 国产卡一卡二在线| 毛片在线导航| 欧美日韩午夜剧场| 免费观看一区二区三区| 97视频精品| 国产精品久久久久久久久久久不卡| av手机免费看| av在线一区二区三区| 性欧美18一19内谢| av在线播放一区| 亚洲欧美另类在线观看| 日本少妇裸体做爰| 粉嫩av一区二区三区| 国产又粗又硬又长| 亚洲日本中文| 亚洲成人动漫在线播放| 欧美人妻一区二区| 国产一区二区中文字幕| 激情五月综合色婷婷一区二区 | 资源网第一页久久久| 成人va天堂| 欧美一区二区三区男人的天堂| 精品人妻一区二区乱码| 亚洲免费专区| 69**夜色精品国产69乱| 日批视频免费播放| 亚洲女同一区二区| 少妇高清精品毛片在线视频| 欧美丝袜足交| 久久中文字幕一区| 天天干天天干天天操| 国产乱国产乱300精品| 久热国产精品视频一区二区三区| 狂野欧美性猛交xxxxx视频| 日韩精品资源二区在线| 我家有个日本女人| 丁香啪啪综合成人亚洲小说 | 国产九九在线观看| 国产一区在线电影| 久久久精品影院| 激情五月婷婷网| 亚洲国产岛国毛片在线| 免费看国产曰批40分钟| 老司机在线精品视频| 久久久精品亚洲| www.综合色| 日韩一区在线播放| 在线a免费观看| 伊人成人网在线看| 欧美一区二区在线| 久久精品黄色| 久久91亚洲精品中文字幕| 黄色小视频免费观看| 懂色aⅴ精品一区二区三区蜜月| 五级黄高潮片90分钟视频| 国产综合网站| 玛丽玛丽电影原版免费观看1977| 成人性生交大片免费网站| 亚洲成**性毛茸茸| 永久免费无码av网站在线观看| 国产黄色精品网站| 国产成人精品免费看在线播放 | 五月久久久综合一区二区小说| 91精品久久久久久久久久入口| 欧美精品日韩少妇| 欧美色精品在线视频| 懂色av懂色av粉嫩av| 91社区在线播放| 性猛交ⅹ×××乱大交| 欧美中文字幕一区二区| 99c视频在线| 欧美国产大片| 欧美精品情趣视频| 99视频在线观看免费| 天天色综合天天| 天美传媒免费在线观看| 成人在线视频一区| 狠狠躁狠狠躁视频专区| 日本欧美肥老太交大片| 国产美女搞久久| xxxcom在线观看| 亚洲国产精品福利| ,一级淫片a看免费| 疯狂做受xxxx欧美肥白少妇| 国产精品夜夜夜爽阿娇| 极品少妇一区二区| 国内外成人免费激情视频| 你微笑时很美电视剧整集高清不卡 | 男操女免费网站| 国精品一区二区三区| 麻豆成人小视频| 一本色道69色精品综合久久| 国内精品久久久久久| 欧美日韩xx| 国产一区二区日韩精品欧美精品| 欧美超碰在线观看| 亚洲高清一区二区三区| 色天使在线视频| 国产精品中文字幕日韩精品| 人人爽人人av| 亚洲在线视频| 亚洲欧美日韩另类精品一区二区三区| 超碰国产精品一区二页| 国产999精品久久久影片官网| 国产美女福利在线| 亚洲国产成人av在线| 97成人在线观看| 欧美伊人久久大香线蕉综合69 | 久久成人综合| 欧美日韩精品久久久免费观看| 亚洲一区导航| 国产欧美一区二区三区四区| 色老头在线观看| 国产婷婷成人久久av免费高清| 精品国产乱码久久久久久蜜臀网站| 91成人网在线| 欧美一区二区三区不卡视频| 偷拍与自拍一区| 日本黄色激情视频| 国产欧美日韩精品一区| 亚洲精品一二三四| 久久精品观看| 成人午夜免费剧场| 综合久久精品| 日本免费高清一区二区| 蜜桃成人av| 成人av电影免费| 亚洲国产欧美国产第一区| 亚洲一区二区三区成人在线视频精品| 在线观看男女av免费网址| 欧美成人免费小视频| gogo在线观看| 欧美国产激情18| av网在线观看| 少妇av一区二区三区| 国产在线观看a视频| 亚洲色无码播放| 亚洲欧美黄色片| 亚洲国产精品999| 国产三级视频在线播放| 日韩视频不卡中文| 免费看日韩av| 日韩久久午夜影院| 国产日本在线视频| 色狠狠久久aa北条麻妃| 婷婷视频在线观看| 亚洲男人的天堂网站| 成人在线高清视频| 亚洲毛片在线看| 日韩一级片免费| 日韩精品在线第一页| 国产资源在线看| yellow中文字幕久久| 免费毛片在线看片免费丝瓜视频 | 亚洲网站视频| 中文字幕免费在线不卡| 午夜日韩av| 日本三级免费网站| 亚洲激情亚洲| 国产一区 在线播放| 亚洲午夜精品一区二区国产| 亚洲精品成人a8198a| 一区二区中文字| 日本a在线免费观看| 日日摸夜夜添夜夜添国产精品| 欧美特级aaa| 免费观看日韩av| 99久久综合网| 久久久欧美精品sm网站| 91视频免费看片| 中文av字幕一区| 人成免费在线视频| 亚洲一区二区3| 国产乱码久久久久久| 在线亚洲欧美专区二区| 久久人人爽人人爽人人片av免费| 精品美女国产在线| 亚洲日本视频在线观看| 欧美日韩另类在线| 国产精品系列视频| 日韩久久久精品| 亚洲高清视频网站| 在线精品91av| 国产美女精品写真福利视频| 国产精品一区二区性色av| 成人性生交大片免费看96| 亚洲高清不卡一区| 亚洲成av人片乱码色午夜| 免费看日本毛片| 国产乱人伦偷精品视频不卡| 亚洲精品国产91| 黄色成人在线播放| 成人福利小视频| 日韩视频在线免费| 男插女视频久久久| 91超碰中文字幕久久精品| 国产美女精品视频免费播放软件| 91久久久久久久一区二区| 自拍欧美一区| 免费观看国产精品视频| 丝袜亚洲精品中文字幕一区| 佐佐木明希电影| 91老司机福利 在线| 国产一级一片免费播放| 欧美色播在线播放| 蜜臀久久久久久999| 久久天堂电影网| 国产网站在线| 岛国一区二区三区高清视频| 亚洲第一福利专区| 杨幂一区欧美专区| 石原莉奈在线亚洲三区| 熟妇无码乱子成人精品| 91免费在线播放| 国产精品7777777| 欧美精品一区二区高清在线观看| 九色在线视频| 日本午夜人人精品| 在线日本制服中文欧美| koreanbj精品视频一区| jvid福利写真一区二区三区| 久青草视频在线观看| 精品国产亚洲一区二区三区在线观看 | 欧美男男同志| 97视频免费在线观看| 日本免费一区二区三区等视频| 久久人人爽爽人人爽人人片av| 激情欧美一区| 人妻无码中文久久久久专区| 国产精品国产三级国产三级人妇| 久久久久97国产| 欧美亚洲动漫精品| av网在线观看| 成人淫片在线看| 经典一区二区| 国产一二三区在线播放| 成人黄色国产精品网站大全在线免费观看 | 国产稀缺精品盗摄盗拍| 精品久久久久人成| www.99视频| 国语自产在线不卡| 欧美三级一区| 亚洲精品一区二区毛豆| 免费欧美在线视频| 国产精品jizz| 在线观看成人小视频| 手机亚洲第一页| 国产成人一区二区三区电影| 97久久综合区小说区图片区| 四虎免费在线观看视频| 青椒成人免费视频| 91网站免费入口| 欧美日韩第一区日日骚| 91精品专区| 国产精品成人播放| 性欧美69xoxoxoxo| 免费看黄色片的网站| 欧美性xxxx极品hd满灌| 性插视频在线观看| 国产精品福利在线| 欧美在线看片| 日韩人妻无码一区二区三区| 亚洲成va人在线观看| 黄色一级a毛片| 国产成人精品国内自产拍免费看 | 三级中文字幕在线观看| 国语精品中文字幕| av成人天堂| 免费看一级黄色| 亚洲第一天堂av| 国产欧美在线观看免费|