精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

能否將擴散模型思想應用于 LLMs 領域?大型語言擴散模型(LLDM)詳解 原創 精華

發布于 2025-4-17 11:14
瀏覽
0收藏

編者按: 當你面對需要高質量逆向推理能力的應用場景時,傳統大語言模型是否讓你感到力不從心?在詩歌逆向補全、邏輯逆向推導等任務中,為什么即使是 GPT-4o 這樣的強大模型也會表現失常?

文章深入介紹了 LLaDA(Large Language Diffusion with mAsking) 這一創新模型的工作原理、訓練過程與性能表現。與傳統自回歸模型不同,LLaDA 借鑒了計算機視覺領域的擴散模型思想,通過逐步去除掩碼來生成文本,而非從左到右逐個生成 token。

性能測試顯示,8B 參數的 LLaDA 基礎模型明顯優于同等規模的 LLaMA 2,并與 LLaMA 3 表現相當。更令人驚喜的是,LLaDA 在逆向推理任務中表現出色,有效解決了自回歸模型在“逆向詛咒”上的局限性,甚至在詩歌逆向補全任務中超越了 GPT-4o 和 Qwen 2.5。

作者 | AI Papers Academy

編譯 | 岳揚

在這篇文章,我們將對《Large Language Diffusion Models》這篇論文進行解析,介紹首個基于擴散模型的 LLM,該模型可與強大的 LLM 相媲美。

能否將擴散模型思想應用于 LLMs 領域?大型語言擴散模型(LLDM)詳解-AI.x社區

Paper authors (Source[1])

01 引言

近年來,大語言模型(LLMs)變得極其強大,為通向通用人工智能(AGI)鋪平了道路。這些模型本質上是自回歸的,即根據給定的 token 序列預測下一個 token。我們可以把這個過程想象成它們在一個詞一個詞地生成回答內容,其中的每個新詞都基于前面已有的詞匯。事實證明,這種方法非常強大,讓我們取得了今天的成就。

然而,這種方法也面臨著一些挑戰。例如,按順序逐個生成 token 的計算成本很高。此外,固有的從左到右的建模方式限制了模型在逆向推理(reversal reasoning)任務中的有效性。 后文將提到一個案例 —— 逆向詩歌補全任務,即給定詩歌中的一句話,模型需要預測詩中這句話前一句的內容。無論如何,有一點值得探討:自回歸建模是否唯一可行的方式?

《Large Language Diffusion Models》對這一假設提出了挑戰。正如 LLMs 是自然語言處理的基石一樣,擴散模型則是計算機視覺領域的王者,是頂級文生圖模型的核心技術。在本文中,我們將解讀研究人員如何將擴散模型應用于語言建模領域。

02 什么是擴散模型?

讓我們先快速回顧一下計算機視覺中的擴散模型,這將有助于我們理解本文的核心思想。

能否將擴散模型思想應用于 LLMs 領域?大型語言擴散模型(LLDM)詳解-AI.x社區

擴散模型逐步去除圖像中的噪聲(Cat images source[2])

擴散模型以提示詞作為輸入,例如“一只貓坐在一臺筆記本電腦上”。模型通過學習逐步去除圖像中的噪聲來生成清晰的圖像。模型從最左側所示的隨機噪聲圖像開始,每一步都去除部分噪聲。去噪過程是以輸入提示詞為條件的,因此最終生成的圖像會匹配提示詞內容。上圖中的三個點(...)表示本例中我們跳過了一些中間步驟。最終我們得到一張清晰的貓圖像,這就是擴散模型根據給定提示詞生成的最終輸出。

在訓練過程中,為了學習如何去除噪聲,我們會逐步向清晰圖像添加噪聲,這個過程稱為擴散過程。該領域已取得一系列進展,但這不是本文的重點。

03 大型語言擴散模型的直觀理解

能否將擴散模型思想應用于 LLMs 領域?大型語言擴散模型(LLDM)詳解-AI.x社區

LLaDA 逐步去除 token 序列中的掩碼

本文介紹的模型名為 LLaDA,全稱是 Large Language Diffusion with mAsking。我們從最左側的 token 序列開始,其中黑色部分表示被掩碼的 token。黃色的未掩碼 token 代表提示詞,黑色的被掩碼 token 代表待生成的響應。請注意,這里的被掩碼的 token 由特殊符號表示,不同于我們之前提到的圖像中疊加的噪聲。

我們逐步去除 token 序列中的掩碼,藍色代表已解除掩碼的 token。最終,我們移除所有掩碼,得到針對輸入提示詞的完整響應。在本例中,清晰的響應 token 序列對應文字為:"從前,在一個小村莊里,住著一只聰明的老貓頭鷹(Once upon a time, in a small village, there lived a wise old owl)"。

04 LLaDA 訓練與推理過程概述

讓我們來深入探討大型語言擴散模型的更多細節。下圖展示了該模型的兩個訓練階段(預訓練與監督式微調)以及推理過程。

能否將擴散模型思想應用于 LLMs 領域?大型語言擴散模型(LLDM)詳解-AI.x社區

LLaDA 訓練過程與推理示意圖(Source[1])

4.1 LLaDA 訓練階段1 —— 預訓練階段

我們從預訓練階段開始,如上圖最左側所示。

頂部是訓練集中的一個樣本序列。我們隨機選擇掩碼比例 t(0 到 1 之間的值),隨后獨立地為每個 token 隨機決定是否掩碼,概率為 t。這一步會產生部分被掩碼的 token 序列。該序列被輸入模型的核心組件 —— mask predictor(這是一個基于 Transformer 的模型),該模型通過計算掩碼 token 上的交叉熵損失,訓練其還原被掩碼的 token。預訓練數據集規模為 2.3 萬億 token。

4.2 LLaDA 訓練階段2 —— 監督式微調

第二個訓練階段是監督式微調,如上圖中間部分所示。此階段的目的是增強 LLaDA 遵循指令的能力。

頂部是包含提示詞和響應的樣本。我們希望訓練模型根據提示詞生成響應。與預訓練類似,我們隨機掩碼樣本中的部分 token,但此次僅掩碼響應部分的 token,保留提示詞完整。隨后,我們將提示詞和部分被掩碼的響應輸入 mask predictor,以恢復響應中被掩碼的 token。此過程與預訓練階段非常相似,區別在于此過程僅掩碼樣本的響應部分。

訓練過程的掩碼比例(決定多少 token 被掩碼)對每個樣本都是隨機的。這意味著在訓練過程中,模型會接觸到幾乎未掩碼的樣本和高度掩碼的樣本。

在這一階段,研究人員使用了 450 萬樣本訓練 LLaDA。由于樣本長度不一致,因此研究人員使用特殊的序列結束 tokens 填充樣本。通過這種方式,模型就能在人類設置的固定長度的(artificial fixed-length)輸入上進行訓練,并能預測序列結束 tokens,從而終止生成過程。

4.3 推理階段:LLaDA 如何生成文本

了解完 LLaDA 的訓練方式后,接下來讓我們回顧一下上圖右側所示的推理過程。

給定提示詞后,會創建包含完整提示詞和被完全掩碼的響應的樣本。然后通過稱為逆向擴散過程(reverse diffusion process)的迭代流程,逐步解除響應部分的掩碼。每次迭代開始時,我們會得到一個包含完整提示詞和被部分掩碼的響應的序列。將其輸入 mask predictor 后,它會預測出所有被掩碼的 token。然而,部分預測出的 token 會被重新掩碼,因此響應仍保持部分掩碼狀態,直到最后一次迭代,我們才會獲得完整響應。

4.4 推理期間的重新掩碼策略

迭代次數是模型的超參數,需要在計算成本與生成質量間權衡(更多迭代次數可提升生成質量)。在每次迭代中,重新掩碼的 token 數量基于總迭代次數。但如何決定哪些 token 需要重新掩碼?研究者未采用隨機方法,而是使用了兩種更有效的策略:

  1. 低置信度重新掩碼(Low-confidence remasking)—— 此方法中,預測置信度最低的 token 會被重新掩碼。對于每個 token,mask predictor 都會從詞表中選擇概率最高的 token 作為預測結果。此處的最高概率代表 token 預測的置信度,反映模型對此 token 相較于其他選項的正確性確定程度。
  2. 半自回歸重新掩碼(Semi-autoregressive remasking)—— 響應長度可能因提示詞而異。對于需要簡短回答的提示詞,大部分響應內容可能是序列結束標記。為避免生成過多高置信度的序列結束標記,會將待生成的響應劃分為多個區塊,并按從左到右順序依次處理。在每個區塊內部應用逆向擴散過程進行采樣。

05 LLaDA Results

5.1 Benchmark Results

能否將擴散模型思想應用于 LLMs 領域?大型語言擴散模型(LLDM)詳解-AI.x社區

LLaDA 與 LLaMA 模型對比(Source[1])

在上圖中,我們對比了 8B 參數的 LLaDA 基礎模型與規模相近的 LLaMA 3 和 LLaMA 2 在多項任務上的表現。使用紅色標注的 LLaDA 明顯優于使用藍色標注的 LLaMA 2,并與使用紫色標注的 LLaMA 3 表現相當,甚至在部分任務上優于 LLaMA 3。

圖中結果為各模型基礎版本的測試結果。未在此圖表展示的經過指令調優的模型性能對比中,LLaMA 3 更具優勢。但需注意,指令調優版 LLaMA 3 在預訓練階段后既進行了監督式微調也進行了強化學習訓練,而指令調優版 LLaDA 僅在預訓練階段后進行了監督式微調。

5.2 LLaDA 在不同規模下的性能擴展規律(LLaDA Scaling Trends)

能否將擴散模型思想應用于 LLMs 領域?大型語言擴散模型(LLDM)詳解-AI.x社區

LLaDA 在語言任務上的性能擴展規律(Source[1])

論文中另一張有趣的圖表展示了 LLaDA 在語言任務上的擴展能力。研究人員以不同訓練計算資源(x 軸顯示)訓練了規模相近的 LLaDA 和自回歸基線模型(autoregressive baselines)。每張子圖代表不同任務,y 軸顯示模型性能。LLaDA 展現出強大的擴展能力,與自回歸基線模型競爭力相當。 在數學數據集 GSM8K 上,LLaDA 的擴展優勢尤為顯著;而在推理數據集 PIQA 上,LLaDA 稍落后于自回歸模型,但隨著浮點運算量(FLOPs)的增加,差距逐漸縮小。

5.3 打破「逆向詛咒」

能否將擴散模型思想應用于 LLMs 領域?大型語言擴散模型(LLDM)詳解-AI.x社區

詩歌補全任務上的模型性能對比(Source[1])

上表展示了詩歌補全任務上的模型性能對比。該任務要求模型根據給定詩句生成下一句(正向任務)或前一句(逆向任務)。觀察 GPT-4o 的表現,其在正向任務中的性能顯著優于逆向任務,這是自回歸訓練固有的局限性。LLaDA 則在此取得突破,在正向和逆向任務中表現更均衡,并在逆向任務中超越 GPT-4o 和 Qwen 2.5。大型語言擴散模型在更大規模的模型訓練中表現如何,讓我們拭目以待!

06 結語:語言模型迎來新時代?

LLaDA 通過將擴散模型應用于文本生成任務,掀起了語言建模的范式轉變。其雙向推理能力與強大的擴展性,向傳統的自回歸模型發起了挑戰。雖然該模型尚處探索初期,但這場技術躍遷或將定義 AI 發展的下一程,未來可期。

Thanks for reading!

Hope you have enjoyed and learned new things from this blog!

About the author

AI Papers Academy

At AI Papers Academy, we simplify AI research papers and concepts, making AI more accessible.
Our goal is to save you time by breaking down complex ideas into clear, digestible insights.

END

本期互動內容 ??

?有人認為擴散模型對文本生成是‘殺雞用牛刀’,你同意嗎?為什么?

??文中鏈接??

[1]??https://arxiv.org/abs/2502.09992??

[2]??https://developer.nvidia.com/blog/improving-diffusion-models-as-an-alternative-to-gans-part-1/??

原文鏈接:

??https://aipapersacademy.com/large-language-diffusion-models/??


?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
標簽
收藏
回復
舉報
回復
相關推薦
久久免费精品日本久久中文字幕| 欧美一二三四区在线| 日韩欧美手机在线| 99久久一区二区| 99热免费精品| 一区二区三区视频免费| 三级网站免费看| 欧美特大特白屁股xxxx| 亚洲欧美日韩国产手机在线| 精品无人区一区二区三区竹菊| 中国老头性行为xxxx| 午夜精品婷婷| 在线观看国产精品淫| 少妇搡bbbb搡bbb搡打电话| 亚洲精品成人图区| 一区二区三区免费在线观看| 欧美一区二区三区四区夜夜大片 | 久久久久久视频| 国产精品高潮呻吟久久久久| 欧美日韩精品一区二区三区四区| 国产freexxxx性播放麻豆 | 欧美黑人性猛交| 黄色免费一级视频| 亚洲电影男人天堂| 精品裸体舞一区二区三区| 久久久精品麻豆| 忘忧草在线影院两性视频| 亚洲另类在线一区| 亚洲精品美女久久7777777| 手机在线观看免费av| 国产寡妇亲子伦一区二区| 国产精品日韩一区| 色老头在线视频| 亚洲欧美成人| 97婷婷大伊香蕉精品视频| 中文字幕人妻一区二| 日韩精品首页| 一本一本久久a久久精品综合小说| 亚洲一区二区三区综合| 亚洲日本va午夜在线电影| 制服.丝袜.亚洲.另类.中文| 无需播放器的av| 欧美不卡高清一区二区三区| 欧美性videos高清精品| 久久久久久久中文| 成人福利电影| 午夜精品国产更新| 精品成在人线av无码免费看| 国产黄大片在线观看画质优化| 国产精品免费视频一区| 婷婷精品国产一区二区三区日韩| 欧美扣逼视频| 久久久综合精品| 欧美高清性xxxxhdvideosex| 五月婷婷伊人网| 99久久精品免费| 精品欧美一区二区三区久久久| 国产自产一区二区| 99久久免费精品| 九九九九九九精品| 国产在线免费观看| 国产精品日产欧美久久久久| 亚洲一区三区在线观看| 麻豆影视在线观看_| 亚洲日本中文字幕区| 中文字幕一区二区中文字幕| 国产视频在线播放| 一区二区三区四区五区视频在线观看| 欧美 国产 精品| 三级福利片在线观看| 亚洲成人免费影院| 北条麻妃在线视频| 欧美黄页免费| 欧美成人一区二区三区| 成年人的黄色片| 一区二区美女| 日韩中文av在线| 99精品久久久久| 国产美女精品| 国产精品丝袜高跟| av中文在线观看| 成a人片国产精品| 欧美日韩在线一二三| 久久综合之合合综合久久| 亚洲影院理伦片| 国产成人黄色片| 欧美aaa级| 欧美电影精品一区二区| av无码av天天av天天爽| 国产精品成人a在线观看| 欧美激情在线狂野欧美精品| 国产一级18片视频| 久久成人免费日本黄色| 国产日韩一区欧美| a√在线中文网新版址在线| 亚洲精品亚洲人成人网在线播放| 国产v片免费观看| 国产成+人+综合+亚洲欧美| 日韩精品影音先锋| 精品人妻无码一区二区三区换脸| 91精品国产乱码久久久久久| 97视频在线观看免费| 亚洲天堂网视频| 99久久婷婷国产精品综合| 综合国产精品久久久| 妞干网免费在线视频| 欧美日韩视频在线第一区 | 第四色在线一区二区| 精品视频在线播放色网色视频| 亚洲精品自拍视频在线观看| 国产一区成人| 91嫩草视频在线观看| 国产69精品久久app免费版| 亚洲一区二区视频在线| 九九热精品在线播放| 欧美日韩导航| 欧美剧在线观看| 中文字幕免费播放| 久久综合成人精品亚洲另类欧美 | 亚洲福利精品在线| 亚洲aaa视频| 免费在线欧美黄色| 国产欧美一区二区在线播放| 黄a在线观看| 欧美亚洲综合网| 日韩人妻无码一区二区三区| 激情综合久久| 91嫩草在线| 国产福利在线播放麻豆| 欧美人狂配大交3d怪物一区| 国产精品揄拍100视频| 激情91久久| 91免费电影网站| 91在线网址| 91精品办公室少妇高潮对白| 国产一级伦理片| 国产在线日韩| 99精彩视频在线观看免费| 成人影欧美片| 7777精品伊人久久久大香线蕉| 性猛交ⅹxxx富婆video| 久久久精品日韩| 久久精品ww人人做人人爽| 黄视频网站在线观看| 日韩精品一区二区三区视频在线观看| 自拍偷拍第9页| 激情五月播播久久久精品| 亚洲最大免费| 天天综合在线观看| 久久精品久久久久| 99国产精品久久久久久久成人| 亚洲欧洲日本在线| 日韩av自拍偷拍| 91成人网在线观看| 97se亚洲综合| wwwww亚洲| 日韩av影视在线| 国产无遮挡免费视频| 成人黄色av电影| 国产原创popny丨九色| 亚洲成人一品| 国产精品九九九| 日韩子在线观看| 欧美一区二区三区爱爱| 九热这里只有精品| 2017欧美狠狠色| 亚洲高清在线免费观看| 国产精品传媒精东影业在线| 99re国产| 一个人www视频在线免费观看| 亚洲欧美中文在线视频| 中文无码av一区二区三区| 成人免费在线视频| www男人天堂| 老鸭窝亚洲一区二区三区| 午夜精品一区二区三区在线观看 | 精品婷婷色一区二区三区蜜桃| 久九九久频精品短视频| 色老头一区二区三区在线观看| 国产精品老熟女视频一区二区| 亚洲九九爱视频| 国产精品300页| 蜜桃视频第一区免费观看| 免费看日b视频| 久久成人av| 91在线|亚洲| 在线免费日韩片| 久久久精品美女| 亚州av在线播放| 欧美日本一区二区在线观看| 免费视频网站www| 久久久精品天堂| 欧美性受xxxx黒人xyx性爽| 国产欧美二区| 国产精品无码乱伦| 日韩动漫一区| 亚洲一区二区少妇| 三级成人黄色影院| 色综合久久悠悠| 国产三区四区在线观看| 精品av综合导航| 国产精品综合在线| 欧美午夜影院在线视频| 久久久91视频| 中文字幕高清一区| 中文字幕一区二区人妻电影丶| 老司机一区二区| 国产一区二区在线视频播放| 久久久久蜜桃| 日韩国产美国| 青青草久久爱| 91久久精品www人人做人人爽 | 日韩视频三区| 国产日产欧美一区二区| 精品国产乱码久久久久久蜜坠欲下| 国产成人女人毛片视频在线| 婷婷久久免费视频| 国产精欧美一区二区三区| 国产精品xx| 欧美激情在线狂野欧美精品| 综合久久2o19| 精品久久国产精品| 在线观看免费黄视频| 亚洲欧美日韩网| 天天干视频在线| 精品欧美黑人一区二区三区| 国产精品无码白浆高潮| 欧美亚洲愉拍一区二区| 懂色av中文字幕| 色综合天天综合网天天看片| 久久夜靖品2区| 亚洲电影第三页| 久草视频免费在线播放| 亚洲伦理在线精品| 色欲一区二区三区精品a片| 国产精品美女视频| 影音先锋男人看片资源| 国产欧美日韩在线观看| 中文字幕国产专区| 91久色porny| 亚洲欧美色图视频| 久久亚洲一级片| 亚洲日本精品视频| 久久久久久久性| 受虐m奴xxx在线观看| 久久五月婷婷丁香社区| 成年人网站免费在线观看| 久久综合av免费| 免费看黄色的视频| 国产欧美一区二区三区在线看蜜臀 | 欧美日韩一区二区三区四区五区六区| 久久国产精品99久久人人澡| 中日韩av在线播放| 国产中文字幕一区| 久久av一区二区三| 成人动漫av在线| 欧美bbbbb性bbbbb视频| 国产网红主播福利一区二区| 色哟哟精品观看| 国产精品夫妻自拍| 久久精品www| 亚洲va欧美va国产va天堂影院| 日韩少妇高潮抽搐| 欧美性xxxxx极品| 日韩国产成人在线| 欧美疯狂性受xxxxx喷水图片| 国产高中女学生第一次| 欧美精品一区二区三区在线播放 | 337p粉嫩大胆色噜噜噜噜亚洲| 四虎永久免费在线观看| 亚洲欧洲三级电影| 国产一级淫片a| 色哟哟在线观看一区二区三区| 亚洲一区二区视频在线播放| 日韩一二三四区| 少妇性bbb搡bbb爽爽爽欧美| 中文字幕日韩欧美| 免费在线看污片| 日本道色综合久久影院| 综合久草视频| 精品国产综合久久| 日韩av自拍| 亚洲中文字幕无码av永久| 三级在线观看一区二区 | 99国产麻豆精品| 无码人中文字幕| 亚洲线精品一区二区三区八戒| 日韩黄色在线播放| 91精品国产高清一区二区三区| 天堂在线中文字幕| 久久精品国产视频| 欧亚av在线| 91久久久在线| 欧美一级色片| 日韩视频一二三| 国产精品入口66mio| 伊人成人免费视频| www日韩大片| 一级黄色录像视频| 欧美亚洲精品一区| 亚洲 欧美 激情 小说 另类| 久久久国产精品视频| 亚洲黄色免费av| 国产精品高清一区二区三区| 久久中文字幕二区| 成人一级片网站| 国产91精品一区二区麻豆亚洲| 亚洲欧美va天堂人熟伦| 亚洲不卡一区二区三区| 国产精品乱码久久久| 国产亚洲欧美日韩精品| 9lporm自拍视频区在线| 成人在线播放av| 狠狠操综合网| 男人天堂1024| 成人av免费在线观看| 男女羞羞免费视频| 欧美日韩和欧美的一区二区| 黄色片视频在线观看| 97超碰蝌蚪网人人做人人爽| swag国产精品一区二区| 欧美 另类 交| 久久 天天综合| 亚洲色图 激情小说| 一本色道a无线码一区v| 四虎永久在线精品免费网址| 成人444kkkk在线观看| 四虎成人精品一区二区免费网站| 日韩欧美亚洲日产国产| 日一区二区三区| 成人影视免费观看| 懂色av中文一区二区三区天美| 欧美天堂在线视频| 欧美国产极速在线| 欧美a在线观看| 99re99热| 国产一区在线观看麻豆| 99热这里只有精品4| 欧美日韩精品电影| 免费在线看黄色| 91精品久久久久久综合乱菊 | 亚洲一区中文字幕永久在线| 国产性色av一区二区| 澳门av一区二区三区| 亚洲国产婷婷香蕉久久久久久99| 日韩精品一级二级 | 国产美女精品免费电影| 久久激情电影| 亚洲va在线va天堂va偷拍| 亚洲欧洲美洲综合色网| 99热这里精品| 色在人av网站天堂精品| 天堂va欧美ⅴa亚洲va一国产| 青青草综合在线| 成人午夜短视频| 97免费在线观看视频| 亚洲女人被黑人巨大进入al| 最新日韩一区| 一区二区三区久久网| 国产在线不卡一卡二卡三卡四卡| 国产女人被狂躁到高潮小说| 欧美大片国产精品| 欧美裸体视频| 亚洲一区二区三区欧美| 国产麻豆精品久久一二三| 久久精品免费在线| 亚洲精品在线观看www| 亚洲精品555| 超级碰在线观看| 99精品视频一区二区| 怡红院男人天堂| 欧美www在线| 亚洲日产av中文字幕| 91亚洲免费视频| 一个色在线综合| 视频国产在线观看| 成人免费午夜电影| 尤物在线精品| 在线观看亚洲大片短视频| 日韩一区二区电影| 中文字幕高清在线播放| 亚洲美女自拍偷拍| av成人免费在线观看| 中文字幕二区三区| 久久噜噜噜精品国产亚洲综合| 欧美精品一区二区三区中文字幕| 午夜影院免费观看视频| 欧美日韩亚洲一区二区| 暖暖日本在线观看| 九色一区二区| 国产一区福利在线| 国产乱码77777777| 久久久爽爽爽美女图片| 日韩国产综合| 亚洲国产第一区| 69久久99精品久久久久婷婷| 在线天堂新版最新版在线8| 今天免费高清在线观看国语| 久久久午夜精品理论片中文字幕| 国产免费的av|