arXiv開始拒收綜述論文了?「論文DDoS」這事,這篇NeurIPS論文早有討論
近日,全球人工智能和計算機科學學術圈被一條消息刷屏:arXiv,這個領域內最重要的預印本服務器,突然宣布了一項重大的實踐更新。
即日起,所有投稿至 arXiv 計算機科學分類的綜述性文章(review/survey)和立場性文章(position paper),必須首先通過期刊或正式會議的同行評審,并附上已獲接收的證明,否則很可能會被拒絕。
消息一出,科研圈一片嘩然。arXiv 明確指出,這場風波的源頭正是生成式 AI 與大語言模型。
然而,就在 arXiv 官方拉響警報的前幾周,一篇中稿 2025 年 NeurIPS Position Paper Track 的立場性文章恰好也登上了 arXiv。它的標題精準地概括了這場危機:《Stop DDoS Attacking the Research Community with AI-Generated Survey Papers》。來自上海交通大學的研究團隊精準地預見、識別、量化并命名了這場由大模型引發的學術界危機。該論文的作者團隊來自上海交通大學,第一作者為安泰智能計算研究院助理教授林江浩,通訊作者為計算機學院張偉楠教授。

- 論文標題:Stop DDoS Attacking the Research Community with AI-Generated Survey Papers
- 論文鏈接:https://arxiv.org/abs/2510.09686
AI 綜述不僅是洪水漫灌,更是 DDoS 攻擊
這篇論文的核心貢獻,在于提出了一個極度精準的隱喻:“綜述論文 DDoS 攻擊”(Survey Paper DDoS attack)。這個概念的精妙之處在于,它點明了問題的本質遠非 “論文太多、大水漫灌” 那么簡單。
- 什么是技術上的 DDoS 攻擊?在計算機網絡安全領域,拒絕服務攻擊(Denial-of-Service Attack,DDoS)是指黑客利用大量 “僵尸電腦”,向一個目標服務器發送海量的無意義請求流量,耗盡服務器的處理能力,導致真正的用戶無法訪問服務。
- 什么是 “綜述論文 DDoS 攻擊”?它指的是不受控制地擴散那些表面上全面,但實際上冗余、低質量,甚至包含幻覺的 AI 生成綜述論文,通過預印本平臺大規模進入學術界。這些大批量 AI 綜述的攻擊目標不是服務器,而是學術界最稀缺的資源:研究人員的有限注意力和同行評審的有限容量。
這導致的后果和 DDoS 攻擊一樣,它構成了事實上的 “拒絕服務”。當有價值的、深刻的見解被海量的 AI 生成內容所淹沒時,研究人員(尤其是新手)就等于被 “拒絕訪問” 到真正的學術洞察,研究者的有限注意力也將被無限分散。
arXiv 的緊急措施,就是這臺 “服務器” 在不堪重負時,被迫切斷部分流量的無奈之舉。
量化證據鏈:“后 2022 時代” 的數據激增
這篇論文中,作者們通過實證與數據分析,精準量化、驗證并揭示了這場 “綜述論文 DDoS 攻擊” 的規模和來源。
他們收集并分析了 2020 年至 2024 年間 arXiv 上共計 10,063 篇 CS 領域的綜述論文。研究結果(如下圖)揭示了一個清晰無誤的轉折點 ——“后 2022 年激增”(Post-2022 Spike)。

論文從三個維度進行量化分析:
1. CS 綜述論文總量:呈爆發式增長,尤其在 2022 年以后,論文數量激增,研究者已不堪重負。
2. 平均 AI 生成分數:AI 內容檢測分數翻了一倍多,清晰表明 AI 是這場增長的核心驅動力。
3. 可疑的發表行為:那些在短期內(一個月內)以極少合作者(少于 2 人)發表超過 3 篇綜述的異常作者數量激增,指向 AI 輔助下的批量生產。
而 2022 年底,正是 ChatGPT 發布并引發全球生成式 AI 浪潮的時刻。這映證了學術界正在經歷的不是正常的學術增長,而是一場由 AI 工具驅動的、混雜著大量可疑動機的內容沖擊。
為了確保量化分析結論的穩健性,該團隊還使用了多種不同的 AI 內容檢測器(如 DeTeTeCtive, MAGE)和規則式方案(如引用重復度、語義相似性)進行交叉驗證,結果均顯示了同樣的后 2022 年激增趨勢。
危害:不只是 “噪音”,更是 “文獻投毒”
如果 AI 生成的綜述只是數量多,那它們僅僅是噪音。但這篇論文指出,真正致命的是其質量參差不齊、重復冗余的特性,這正在對學術生態造成系統性破壞。
傳統的、由專家撰寫的綜述是學術的燈塔,它們提供深刻的洞見、批判性的分析和高屋建瓴的分類。而 AI 生成的綜述,往往存在以下四種典型缺陷:
1. 結構性空洞(Structural Differences):它們通常只是 “無組織的主題枚舉”,缺乏清晰的敘事流程和邏輯結構。讀起來就像是一份沒有靈魂的文獻清單。
2. 缺乏創新的分類法(Lack of Novel Taxonomy):高質量綜述的核心價值是提出全新的視角和分類體系。而 AI 綜述只會 “模仿現有的分類”,有時甚至只是拙劣地復述維基百科的詞條。
3. 引文與內容錯漏(Citation and Content Inaccuracy): AI 綜述極有可能出現捏造的或不正確的參考文獻與內容。這就是 LLM 的幻覺問題,它正在被不加鑒別地復制粘貼到本應嚴謹的學術記錄中,并且在下一輪 AI 深度調研中被進一步廣播。
4. 高度冗余和極低的邊際效用(Redundancy and Low Marginal Utility):AI 極大地降低了 “灌水” 成本。論文作者觀察到,某個新興主題在短短一個月內就出現了超過五篇的綜述預印本。這絕對是多余的,當 “第 N 篇關于 X 的綜述” 發表時,其 “邊際學術價值幾乎為零”。
當這四個要素結合在一起,由 “綜述論文 DDoS 攻擊” 產生了 “文獻投毒”(Literature Poisoning)現象:
- 綜述論文是新入行的研究生和跨領域學者的 “第一站” 和 “入門指南”。如果這些指南本身就充滿了 AI 的幻覺、錯誤的引用和膚淺的分類,那么下一代的研究人員從一開始就可能被植入了錯誤的學術前提。
- 更糟糕的是,這些低質量的 AI 綜述開始互相引用,在學術搜索引擎(如谷歌學術)上制造虛假繁榮,形成自我強化的循環。最終,垃圾文獻看起來引用量很高,而真正奠基性的工作反而被埋沒。這不僅扭曲了學術評價體系,更從根本上侵蝕了整個學術界的信任根基。
出路:從封堵到新機制構建
面對如此嚴峻的 “DDDoS 攻擊” 和 “文獻投毒”,我們該怎么辦?
例如 arXiv 的新規正是一種防御性的緊急熔斷措施。
該論文的作者也給出了自己的解決方案,分為兩部分:近期的務實策略和長期的愿景革新。論文在文中提出了一系列政策建議,包括:
- 作者透明度要求:作者必須明確披露在寫作過程中對 LLM 的使用情況。
- 對綜述提交進行更嚴格的審查:例如,為綜述分配資深審稿人,并在審稿表格中增加特定問題,如本綜述是否引入了新的洞見或有意義的分類法。
- 在審查中引入 AI 檢測和驗證:使用工具進行篩查,并抽查參考文獻的真實性。
- 激勵高質量綜述:例如,設立最佳綜述論文獎,獎勵質量而非數量。
更進一步,作者們認為,在 AI 時代,僅僅依靠 “封堵” 和 “提高門檻” 是被動的,我們必須主動擁抱變革,用更先進的范式來解決問題。由此,作者們提出了一種構想:動態實時綜述(Dynamic Live Surveys, DLS)。
簡單來說,不要再寫那種一次性的、靜態的、存在過時風險的 PDF 綜述了。我們應該借鑒維基百科、GitHub、甚至 Google Doc 的平臺,為每個研究領域建立一個由社區共同維護的、版本可控的在線知識庫,并構建 “人 - AI 協作的策展循環”(Human-AI Curation Loop):
- AI 做它擅長的:一個 LLM 代理每天自動掃描 arXiv、頂會等,抓取最新的論文、摘要、圖表和關鍵結果。它負責聚合和初步總結。
- 人做人擅長的:真正的領域專家介入,提供 AI 無法給予的深度見解。他們負責提煉分類法、協調沖突的觀點、提供批判性分析和把握方向。
這種模式從根本上解決了現有問題:它能解決冗余(一個主題或分類方法只需要一個 DLS),能保證質量(由人類專家掌舵),也能解決時效性(實時更新)。
這種模式不再將 AI 視為洪水猛獸,而是將其轉變為強大的科研助手,讓人類專家從繁瑣的文獻整理中解放出來,專注于最高價值的思考和洞察。
結語
arXiv 的新規是一個重要的信號,它標志著學術界對 AI 沖擊波的被動防御已經開始。這是一個必要的 “止血帶”。
而上海交大團隊的這篇論文,不僅精準預言、量化并概括了這場危機(綜述論文 DDoS 攻擊和文獻投毒),更指明了一條可能的路徑措施。即,我們不能永遠停留在 “提高圍墻” 的防御姿態上,在 AI 時代,我們必須主動進化,從靜態的、孤立的 “論文發表” 模式,轉向動態的、協作的 “知識策展” 模式。


































