TTD-DR:基于測試時(Test-Time)擴散的深度研究Agent突破
谷歌在擴散技術領域持續發力。這次,他們將擴散技術應用于深度研究agent,專門用于優化研究報告生成過程。該方法在長篇研究任務中對比OpenAI Deep Research取得了69.1%的勝率。
圖片
論文提出了測試時擴散深度研究員(TTD-DR),重新思考了深度研究agent生成長篇報告的方式。TTD-DR沒有依賴傳統的靜態推理策略(如思維鏈或最優N選擇采樣),而是將報告生成過程構建為擴散過程——從噪聲草稿開始,通過檢索增強的去噪過程進行迭代優化,并由結構化計劃進行指導。
圖片
以草稿為骨架 TTD-DR從初步報告草稿和研究計劃開始。這個不斷演進的框架會指導應該發起哪些搜索查詢,以及如何整合新信息,從而在研究生成過程中提升連貫性和時效性。
圖片
基于檢索的去噪 噪聲草稿通過類似擴散的方式反復修訂,每個步驟都包括發起新的搜索查詢、整合檢索到的內容并更新草稿。這個循環持續到收斂為止,確保外部知識的及時融入。
組件級自進化 研究工作流程中的每個單元(計劃生成、查詢構建、答案綜合、最終寫作)都有自己的優化循環。這種進化使用了多變體采樣、LLM評判打分、基于批評的修訂以及交叉合并等技術來選擇高適應性的輸出。
卓越成果 在五個基準測試(LongForm Research、DeepConsult、HLE-Search、HLE-Full和GAIA)中,TTD-DR始終優于來自OpenAI、Perplexity和Grok的agent。例如,在長篇生成任務中對比OpenAI Deep Research達到69.1%的勝率,在短篇多跳問答任務中獲得4.8%至7.7%的提升。
圖片
高效擴展 與僅使用骨架和僅使用自進化的變體相比,完整的TTD-DR系統實現了最優的性能/延遲權衡,表明基于檢索的去噪是一種高效的測試時擴展策略。
這又是一篇將擴散、自進化算法和結構化規劃等理念巧妙結合的優秀論文,為構建更先進的長篇研究報告生成agent提供了新思路。
論文鏈接:???https://arxiv.org/abs/2507.16075??
本文轉載自??????AI帝國??????,作者:無影寺

















