精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

rebuttal真的有用!這篇ICLR論文,所有審稿人都加了2分,直接躍升排名第9

人工智能 新聞
這篇論文提出的 Sana 是一種高效且經濟地訓練和合成高質量圖像的工作流程,并且支持 1024×1024 到 4096×4096 的分辨率。

最近,正處于評議階段的 ICLR 2025 論文真是看點連連,比如前些天爆出的 ICLR 低分論文作者硬剛審稿人的事件以及今天我們要介紹的這個通過 rebuttal(反駁)硬是將自己的平均分拉高 2 分,直接晉升第 9 名的論文。

圖片

圖片

ICLR 2025 論文評分分布圖,圖源:https://papercopilot.com/statistics/iclr-statistics/iclr-2025-statistics/

順帶一提,不知道是不是因為 ICLR 2025 審稿過程狀況連連,官方此前還決定將論文討論過程延長 6 天。

圖片

下面我們就來看看這篇「咸魚翻身」的論文究竟研究了什么以及它的評審和反駁之路。

圖片

  • 論文標題:SANA: Efficient High-Resolution Image Synthesis with Linear Diffusion Transformers
  • 論文地址:https://arxiv.org/abs/2410.10629
  • OpenReview:https://openreview.net/forum?id=N8Oj1XhtYZ
  • 項目地址:https://nvlabs.github.io/Sana/
  • 代碼地址:https://github.com/NVlabs/Sana

論文主要內容

這篇論文提出的 Sana 是一種高效且經濟地訓練和合成高質量圖像的工作流程,并且支持 1024×1024 到 4096×4096 的分辨率。下圖展示了 Sana 生成的一些圖像樣本及其推理延遲情況。

圖片

作者表示:「據我們所知,除了 PixArt-Σ 之外,還沒有直接探索 4K 分辨率圖像生成的已發表研究成果。然而,PixArt-Σ 僅能生成接近 4K 分辨率(3840×2160)的圖像,并且生成這種高分辨率圖像的速度相對較慢。」

那么,這個來自英偉達、MIT 和清華大學的研究團隊是如何做到這一點的呢?

具體來說,他們提出了多項核心設計。

深度壓縮自動編碼器

該團隊提出了一種新的自動編碼器(AE),可將縮放因子(scaling factor)大幅提升至 32!

過去,主流的 AE 僅能將圖像的長度和寬度壓縮 8 倍(AE-F8)。與 AE-F8 相比,新提出的 AE-F32 輸出的潛在 token 量可減少 16 倍。這對高效訓練和生成超高分辨率圖像(例如 4K 分辨率)至關重要。

下表 1 展示了不同 AE 的重建能力。

圖片

圖 3 則展示了對新提出的深度壓縮自動編碼器進行消融實驗的結果。該結果證明了新 AE 各項設計的重要性。

圖片

高效的線性 DiT

圖片

該團隊還提出使用一種新型的線性 DiT 來替代原生的二次注意力模塊,如上右圖所示。

原始 DiT 的自注意力的計算復雜度為 O (N2)—— 在處理高分辨率圖像時,這個復雜度會二次級增長。該團隊將原生注意力替換成線性注意力后,計算復雜度便從 O (N2) 降至 O (N)。

圖片

該團隊表示:「我們認為,通過適當的設計,線性注意力可以實現與原生注意力相當的結果,并且還能更高效地生成高分辨率圖像(例如,在 4K 時加速 1.7 倍)。

同時,他們還提出了 Mix-FFN,其作用是將 3×3 深度卷積集成到 MLP 中以聚合 token 的局部信息。

Mix-FFN 的直接好處是不再需要位置編碼(NoPE)。該團隊表示:「我們首次刪除了 DiT 中的位置嵌入,并且沒有發現質量損失。」

使用僅解碼器小 LLM 來作為文本編碼器

為了提升對用戶提示詞的理解和推理能力,該團隊使用了最新版的 Gemma 作為文本編碼器。

盡管這些年來文生圖模型進步很大,但大多數現有模型仍然依賴 CLIP 或 T5 進行文本編碼,而這些模型通常缺乏強大的文本理解和指令遵從能力。僅解碼器 LLM(例如 Gemma)表現出的文本理解和推理能力很強大,還能有效遵從人類指令。

下表比較了不同文本編碼器的效果。

圖片

通過直接采用 LLM 作為文本解碼器,訓練不穩定的問題得到了解決。

另外,他們還設計了復雜人類指令(CHI),以充分理解 LLM 那強大的指令遵從、上下文學習和推理能力,進而更好地對齊圖像與文本。從下圖可以看到,有無 CHI 的輸出結果差異非常明顯。

圖片

高效的訓練和推理策略

為了提升文本和圖像的一致性,該團隊提出了一套自動標注和訓練策略。

首先,對于每張圖像,使用多個 VLM 來重新生成描述。雖然這些 VLM 的能力各不相同,但它們的互補優勢可提高描述的多樣性。

他們還提出了一種基于 Clip Score 的訓練策略,即對于一張圖像的多個描述,根據概率動態選擇具有高 Clip Score 的描述。實驗表明,這種方法可以提高訓練收斂性和文本圖像對齊程度。下表比較了訓練期間不同的圖像 - 文本對采樣策略的效果。

圖片

此外,他們也提出了一種 Flow-DPM-Solver,相比于廣泛使用的 Flow-Euler-Solver,這種新的求解器可將推理采樣步驟從 28-50 步減少到 14-20 步,同時還能實現更好的結果。見下圖。

圖片

實驗結果

總體實驗下來,該團隊的新模型 Sana-0.6B 表現可謂極佳。在生成 4K 圖像時,速度比當前最佳(SOTA)的 FLUX 方法快 100 多倍(見下圖 2)。在生成 1K 分辨率圖像時,也快 40 倍(見下圖 4)。同時,Sana-0.6B 的效果在許多基準上都能與 FLUX 比肩!

圖片

圖片

不僅如此,他們還訓練了一個參數量更大的 Sana-1.6B 模型。下表更詳細地展示了這兩個模型的性能表現,可以看到,對于 512 × 512 分辨率,Sana-0.6 的吞吐量比大小相近的 PixArt-Σ 快 5 倍,并且在 FID、Clip Score、GenEval 和 DPG-Bench 方面表現明顯優于后者。對于 1024 × 1024 分辨率,Sana 比大多數模型強得多。這些結果說明 Sana 確實實現了低延遲、高性能的圖像生成。

圖片

此外,他們還為 Sana 打造量化版本,并將其部署到了邊緣設備上。

在單臺消費級 4090 GPU 上,該模型生成 1024×1024 分辨率圖像只需 0.37 秒,是一個非常強大的實時圖像生成模型。

圖片

下面展示了 Sana-1.6B 模型的一些輸出結果以及部署量化版模型的筆記本電腦。

圖片

rebuttal 真的有用?

很多時候,在審稿人的第一印象已經確定的情況下,rebuttal 能夠改變的不多。

正如知名長文《審稿 CVPR 而致的傷痕文學(續):關于 Rebuttal 的形而上學》所說,從審稿人的角度來看,收到 rebuttal 時,可能早就已經忘了當時為什么會給這個審稿意見,對這篇文章的唯一記憶就是「我要拒掉它」。

圖片

引自 https://zhuanlan.zhihu.com/p/679556511 作者 @Minogame

那么,SANA 到底拿出了一份怎樣的 rebuttal,四個審稿人看過后不再「已讀不回」,反倒不約而同地加了 2 分呢?

第一位審稿人和第三位審稿人的意見比較相似,他們認為 SANA 的原創性有些不足。具體來說,第一位審稿人在缺點部分寫道:

  • SANA 的三個主要組件在文獻中已有探討:深度自編碼器在 [1] 中有涉及,線性 DiT 在 [2] 中已有研究,[3, 4] 中已經使用了 LLM 作為文本編碼器。將這些組件結合起來并不構成一個真正具有創新性的想法。
  • 作者沒有充分解釋他們的 CHI 流程是否與 [5] 中的相同。如果相似,那么這甚至會進一步削弱該工作的創新性。

圖片

第三位審稿人則希望作者們補一些消融實驗,逐個組件分析,明確 SANA 相較于 PixArt-Σ 和 Playground v3 等類似的模型有什么創新之處。

圖片

SANA 的研究團隊首先詳細地說明了站巨人的肩膀上創新和做學術裁縫的區別。

比如,LinFusion 中的線性注意力是蒸餾策略的一部分,而作者們把 SANA 作為一個基礎生成模型,從頭開始設計、訓練。為了讓線性注意力在所有層中代替原來的自注意力,他們做出了 Mix-FFN 解碼器。

這樣,相比其他方法將所有 token 映射到一個低秩的 NxN 狀態中,SANA 更接近于直接的 O (N) 注意力計算,這是以前的研究未能有效解決的問題。

對比同樣提交給 ICLR 2025 的「DC-AE」,SANA 解決了未涉及的獨特問題,比如簡單地在潛在空間中增大通道(F8C4→F32C32)會使得訓練收斂速度大大減慢,他們設計了線性注意力 + Mix-FFN 塊加速收斂。

而此前 LLM 作為文本編碼器的方法,更多只是簡單地用 LLM 替代了 T5/Clip,并未像 SANA 一樣深入研究了如何激發 LLM 的推理能力。

針對審稿人的問題,作者補充了一系列消融實驗,比較了 LiDiT 和 SANA 的 CHI 效果,并逐個組件地展示了 SANA 在 PixArt-Σ 基礎上的進展。

圖片

這兩位審稿人也是給出了一個提分的大動作:

圖片

圖片

第二位審稿人更在意技術細節,他覺得 SANA 如何搭建的線性注意力模塊還可以說得更清楚。

具體來說,需要明確一下,他們是如何實現線性注意力能全局替代傳統自注意力,同時保持足夠的上下文信息和依賴關系建模的,還要補 4096*4096 分辨率的圖像與其他方法的實驗對比。

圖片

在一通極其詳細的解釋之下,這位(可能不清楚目前沒有 4K 版本 InceptionNet 的)審稿人也把分數也提了 2 分。

圖片

第四位審稿人則給出了 10 分的最高分評價。

圖片

一開始,該審稿人指出了這篇論文的一些缺點,包括表 9 中的 Gemma2-2B-IT 模型需要解釋、需要進一步比較 Gemma2 和 T5-XXL 以及缺乏對 UltraPixel 等引用等等。

然后,作者對該審稿人的四個問題逐一進行了詳細解答,并為論文內容做了進一步的補充。此后,又是關于 ClipScore 的幾個來回討論。

圖片

最后,審稿人被作者說服,表示:「我再也看不到這篇論文中任何明顯的缺點了。因此,我提高了我的評分。這項工作確實應該作為會議的亮點!很出色的工作!」

圖片

從這些審稿人與作者的互動可以看到,建設性的討論和修正確實可以幫助改善審稿人對一篇論文的看法。

在多次交流中,審稿人對論文中不清晰或薄弱的部分提出了具體改進建議,而作者也根據反饋進行了細致的修改。這種積極的互動不僅使論文的質量得到了提升,也促進了審稿人與作者之間的理解與信任。最終,審稿人對論文的評審意見變得更加正面,并愿意為作者提供更多的指導。

對此,你有什么看法?

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-04-21 19:18:38

論文

2022-11-25 17:33:15

論文技巧

2023-10-07 13:16:20

GPT-4NatureICLR

2025-11-21 09:04:18

2024-12-02 09:00:00

2024-10-17 13:09:14

2025-08-27 15:39:58

LLM模型AI

2025-11-14 09:11:48

2009-04-20 08:42:01

美國IT企業惠普

2025-02-27 12:30:00

2015-07-24 09:48:19

IT內容管理硬件奪冠深信服

2021-03-22 10:14:10

技術研發論文

2021-05-28 10:10:22

AI 數據人工智能

2021-07-19 15:02:48

機器人人工智能算法

2024-11-29 14:00:07

2024-12-09 10:50:00

2020-12-07 09:22:50

量子計算機芯片超算

2019-05-29 14:48:43

2024-08-13 14:40:00

AI科學家

2018-03-20 09:51:32

程序員開發工具
點贊
收藏

51CTO技術棧公眾號

欧美成人精品| 国产精品无码在线| 少妇av在线播放| 欧美资源在线| 日韩中文字幕免费看| 午夜诱惑痒痒网| 国产一二三在线| 中文字幕+乱码+中文字幕一区| 亚洲精品免费网站| www.av麻豆| 日韩欧美精品一区| 亚洲成人xxx| 亚洲xxxx2d动漫1| 女同一区二区免费aⅴ| 91在线视频官网| 成人黄色大片在线免费观看| 91午夜视频在线观看| 日产午夜精品一线二线三线| 亚洲第一网站免费视频| 9l视频白拍9色9l视频| 国语对白在线刺激| 中文字幕一区二区视频| 久久久综合亚洲91久久98| 一二三区在线播放| 亚洲欧美视频| 久久久久国色av免费观看性色| x88av在线| 国产精品丝袜在线播放| 欧美二区在线观看| 亚洲 欧美 日韩 国产综合 在线| 快射av在线播放一区| 久久婷婷成人综合色| 古典武侠综合av第一页| 波多野结衣mp4| 9久re热视频在线精品| 久久天天躁狠狠躁老女人| 成人免费无遮挡无码黄漫视频| 99综合99| 欧美日韩五月天| 波多野结衣50连登视频| xxxx视频在线| 亚洲男人天堂一区| 亚洲一区二区四区| 网友自拍视频在线| 国产亚洲一区二区在线观看| 久久99精品久久久久久久青青日本| 精品国精品国产自在久不卡| 久久国产精品99久久人人澡| 国产精品久久综合av爱欲tv| 国产精品久久久久久久久久久久久久久久久 | 国产日韩换脸av一区在线观看| 一级片在线观看免费| 99国产精品99久久久久久粉嫩| 欧美大片免费看| 欧美成人片在线观看| 欧美 亚欧 日韩视频在线| 日韩视频在线免费| 懂色av粉嫩av蜜臀av一区二区三区| 成人av资源电影网站| 在线电影欧美日韩一区二区私密| 久久久久无码精品国产sm果冻| 免费一区二区三区视频导航| 亚洲欧美激情精品一区二区| 熟女俱乐部一区二区视频在线| 午夜精品影视国产一区在线麻豆| 亚洲老头老太hd| 国产jk精品白丝av在线观看 | 丰满白嫩尤物一区二区| 国产精品v欧美精品∨日韩| 丰满肥臀噗嗤啊x99av| 99免费精品视频| 欧美国产视频在线观看| 在线视频1区2区| 亚洲色图欧洲色图婷婷| 免费的一级黄色片| 欧美亚洲日本精品| 在线观看日产精品| 在线观看免费视频高清游戏推荐| 综合久久伊人| 精品国产乱码久久久久久牛牛| 国产人妻人伦精品1国产丝袜| 国产调教一区二区三区| 日韩中文在线视频| 99热精品免费| 亚洲综合精品四区| 91久久久国产精品| 人妻无码中文字幕| 久久综合久久鬼色中文字| 色视频一区二区三区| free性欧美hd另类精品| 亚洲18色成人| 黑森林精品导航| 中文字幕日韩在线| 亚洲色图50p| 男人与禽猛交狂配| 牛夜精品久久久久久久99黑人| 亚州成人av在线| 日韩不卡高清视频| 国产成a人亚洲精品| 日韩高清在线播放| 在线免费观看的av| 在线免费观看日本一区| 91香蕉视频在线观看视频| 亚洲区小说区| 欧美大尺度激情区在线播放| 黄色av网站免费观看| 国产老女人精品毛片久久| 精品在线视频一区二区| 黄视频网站在线看| 色爱区综合激月婷婷| 好吊操视频这里只有精品| 精品久久久中文字幕| 欧美情侣性视频| 做爰视频毛片视频| 99精品欧美一区| 男人草女人视频| 欧美精选视频一区二区| 亚洲精品一线二线三线无人区| 无码人中文字幕| 美女精品网站| 精品日产一区2区三区黄免费| 2024最新电影免费在线观看| 欧美日韩五月天| 久久久久久九九九九九| 最新日韩在线| 成人黄动漫网站免费| caoporn国产精品免费视频| 欧美日韩亚洲精品内裤| 性xxxxxxxxx| 亚洲91视频| 国产精品视频白浆免费视频| 男女av在线| 午夜精品福利久久久| 日本xxxx免费| 亚洲精品极品少妇16p| 国产精品美乳一区二区免费| 欧美孕妇孕交| 欧美午夜精品久久久久久浪潮| jjzz黄色片| 激情欧美亚洲| 国产亚洲第一区| 牛牛精品视频在线| 欧美一级电影网站| 91九色丨porny丨极品女神| 精彩视频一区二区| 伊人色综合影院| 日韩精品第二页| 日韩专区在线播放| 在线观看国产一区二区三区| 中国av一区二区三区| www黄色在线| 精品国产一区二区三区小蝌蚪 | 欧美日产国产成人免费图片| 国产精品一区二区黑人巨大| 亚洲视频在线一区| 9191在线视频| 一区在线免费观看| 久久精品一区二区三区不卡免费视频| 欧美巨大丰满猛性社交| 亚洲欧美综合图区| 亚洲视频在线观看免费视频| 国产精品久久久久久久岛一牛影视 | 91麻豆视频网站| 欧美成人精品欧美一级乱| 色天下一区二区三区| 日本亚洲精品在线观看| jizz在线观看中文| 欧美一区二区三区在线看| 久热这里只有精品在线| 99麻豆久久久国产精品免费| 又色又爽又高潮免费视频国产| 欧美mv日韩| 爱情岛论坛亚洲入口| 日本午夜在线| 国产精品一页| 亚洲欧美国产精品桃花| 欧美性受xxxxxx黑人xyx性爽| 久久久久久视频| 国产伦一区二区| 欧日韩在线视频| 亚洲精品无码久久久| 蜜桃91麻豆精品一二三区| 精品久久久久久中文字幕动漫 | 亚洲一级av无码毛片精品| 成人区人妻精品一区二| 久久人妻无码aⅴ毛片a片app| 精品少妇人妻一区二区黑料社区| www.久久草.com| 色噜噜久久综合伊人一本| 一级片在线观看视频| 亚洲精选在线视频| xxxx黄色片| 日本成人中文字幕在线视频| 欧美中文字幕在线观看视频 | 一区二区影视| 成人午夜电影在线播放| 色偷偷偷在线视频播放| 一区二区福利视频| 亚洲爱情岛论坛永久| 91国产免费看| 久久免费视频精品| 欧美激情一二三区| 好吊色视频一区二区三区| 日韩av一区二区在线影视| gogogo免费高清日本写真| 欧美黑人做爰爽爽爽| 国产+人+亚洲| 午夜不卡视频| 日韩av网址在线| 在线观看毛片视频| 欧美日韩国产精品| 国产一区第一页| 91丝袜呻吟高潮美腿白嫩在线观看| 午夜在线观看av| 一区福利视频| 成人手机在线播放| 欧美一区三区| 国产精品乱码| 先锋影音网一区二区| 国产精品18久久久久久麻辣| 18在线观看的| 亚洲一区999| 天堂网在线播放| 日韩欧美一二三| 中文天堂在线视频| 精品久久久在线观看| 精品爆乳一区二区三区无码av| 中文字幕高清不卡| aaaaa级少妇高潮大片免费看| 国产一区二区三区黄视频 | 欧美中文字幕不卡| 成年人av电影| 亚洲精品综合在线| 99久久精品久久亚洲精品| 久久免费国产精品| 亚洲美女高潮久久久| 国产传媒欧美日韩成人| 手机看片一级片| 日韩中文字幕1| 日韩一级片播放| 免费精品视频| heyzo国产| 亚洲东热激情| 337p粉嫩大胆噜噜噜鲁| 一区二区视频欧美| av 日韩 人妻 黑人 综合 无码| 97视频热人人精品免费| 一区二区视频在线免费| 国产国产精品| 亚洲 欧洲 日韩| 欧美日韩激情在线一区二区三区| 日韩av图片| 精品国产美女| 色一情一乱一伦一区二区三区丨| 精品一区欧美| 日本一区视频在线观看免费| 欧美人与牛zoz0性行为| 欧美日韩电影一区二区三区| 欧美三级三级| 亚洲人成网站在线观看播放| 日韩毛片视频| 91社在线播放| 亚洲国产高清一区二区三区| 欧美一级片免费播放| 99精品国产一区二区青青牛奶| 亚洲中文字幕无码中文字| 国产美女一区| 黄色av免费在线播放| 奇米一区二区三区av| 国产大片一区二区三区| 国产福利精品导航| japanese在线观看| 91在线精品一区二区三区| 亚欧精品视频一区二区三区| 国产精品成人免费| 日本妇女毛茸茸| 国产精品久久免费看| 免费视频一二三区| 五月天久久比比资源色| 日本视频网站在线观看| 欧美精品在线一区二区三区| www.97av| 亚洲美女视频网| av一本在线| 国语自产在线不卡| 伊人久久高清| 4444kk亚洲人成电影在线| 天美av一区二区三区久久| 亚洲韩国在线| 欧美日韩亚洲一区| 欧美s码亚洲码精品m码| 九色porny丨国产精品| 国产免费a级片| 久久网站最新地址| 国产一级大片在线观看| 一本大道久久a久久综合| 在线视频1卡二卡三卡| 精品免费一区二区三区| av午夜在线| 91精品国产免费久久久久久| 欧美a视频在线| 久久久久久久免费| 91嫩草亚洲精品| 国产视频九色蝌蚪| 日本不卡在线视频| 日韩aaaaa| 18成人在线视频| www.国产一区二区| 精品国产一区二区三区不卡| 岛国视频免费在线观看| 欧美激情伊人电影| 国内精品视频| 色爱区成人综合网| 亚洲日韩视频| 欧美又黄又嫩大片a级| 91在线porny国产在线看| 裸体武打性艳史| 在线视频亚洲一区| 日漫免费在线观看网站| 欧美成人免费网| 97成人超碰| 日韩理论片在线观看| 99亚洲精品| 无码人妻一区二区三区免费n鬼沢 久久久无码人妻精品无码 | 久久人人爽人人爽人人片av不| 亚洲欧洲另类精品久久综合| 在线观看一区| 妖精视频一区二区| 亚洲蜜桃精久久久久久久| 亚洲成人av网址| 一区二区福利视频| 依依综合在线| 精品国产91亚洲一区二区三区www| 国产一区二区三区自拍| 911福利视频| 国产精品久久福利| 亚洲一级视频在线观看| 国产亚洲视频在线| 成人影院网站| 欧美国产一二三区| 亚洲综合电影一区二区三区| 国模无码视频一区| 亚洲国产日日夜夜| 亚洲精品国产精| 久久精品夜夜夜夜夜久久| 88xx成人网| 性高潮久久久久久久久| 日韩—二三区免费观看av| 国产三级视频网站| 欧美性视频一区二区三区| 国产区高清在线| 国产精品久久久久久久久影视| 日韩欧美电影| 99九九精品视频| 亚洲精选一二三| 亚洲欧美日韩综合在线| 91精品国产沙发| aiss精品大尺度系列| 欧美久久久久久久久久久久久| 成人av免费在线播放| 欧美精品一区二区蜜桃| 日韩激情片免费| 日产福利视频在线观看| 久久久久成人精品免费播放动漫| 久久中文在线| 美国黄色特级片| 欧美日韩在线不卡| av成人手机在线| 91精品一区二区| 最新成人av网站| 国产精品成人一区二区三区电影毛片 | 伊人伊成久久人综合网小说 | 韩国亚洲精品| 国产av一区二区三区传媒| 欧美性生交xxxxx久久久| 蜜桃视频在线免费| 国产欧美最新羞羞视频在线观看| 欧美女人交a| 欧美亚一区二区三区| 欧美性大战久久| 国产高清在线a视频大全| 激情久久av| 久久字幕精品一区| 岛国毛片在线观看| 日韩精品小视频| 国产精品中文| 欧美成人三级在线视频| 久久精品夜夜夜夜久久| 精品人妻av一区二区三区| 7777免费精品视频| 大胆日韩av| 成人午夜精品无码区| 在线免费av一区| av在线播放网站| 久久大香伊蕉在人线观看热2| 日韩国产高清影视| 四虎成人免费影院| 亚洲激情免费观看| 3d动漫一区二区三区在线观看| 超碰97人人射妻|