精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

OmniThink:如何讓 LLM 寫出有更有深度的文章

發布于 2025-1-22 13:22
瀏覽
0收藏

摘要

機器寫作通常依賴檢索增強生成技術,但這些方法受限于模型預定義的范圍,難以生成信息豐富的內容。普通檢索的信息往往缺乏深度、實用性,且冗余問題嚴重,導致生成的文章內容淺顯、重復且缺乏原創性。為此,我們提出了 OmniThink 框架,它模擬了人類迭代擴展和反思的認知過程。OmniThink 的核心在于模擬學習者逐步深化對主題理解的認知行為。實驗表明,OmniThink 在不犧牲連貫性和深度的前提下,顯著提升了生成文章的知識密度。人類評估和專家反饋進一步證實了 OmniThink 在生成長篇文章中的實際應用潛力。

??https://arxiv.org/abs/2501.09751??

1. 機器寫作的現狀

由于手動寫作成本高昂,機器寫作(Machine Writing)的關注度越來越高。隨著 LLM 和檢索增強生成(RAG)的興起,機器寫作也迎來了新的機遇。

OmniThink:如何讓 LLM 寫出有更有深度的文章-AI.x社區圖片

為確保內容的真實性和實時性,當前基于 RAG 的自動化寫作系統主要依賴檢索內容生成文章(如上圖)。例如:

OmniThink:如何讓 LLM 寫出有更有深度的文章-AI.x社區圖片

? STORM 通過角色扮演的問答方式撰寫維基百科式文章,上圖展示了 STORM 使用 GPT4o 生成的關于 AlphaFold 主題的案例:文章中關于“AlphaFold 是由 DeepMind 開發的” 出現重復表達。

? Co-STORM 引入了用戶參與的信息檢索模式

? AutoSurvey 將該框架應用于學術論文寫作

然而,這些方法仍局限于角色自身的范圍,難以生成深度內容并突破知識邊界。檢索到的信息往往缺乏深度、實用性和冗余性,直接影響生成文章的質量,導致輸出內容淺顯、重復且缺乏原創性。

人類在寫作過程中可以自然地避免這些陷阱,通過反思實踐理論(the Theory of Reflective Practice)可以解釋該現象。

根據該理論,人類作者會不斷反思之前收集的信息和個人經驗,重新組織、篩選和優化認知框架。使作者迭代調整寫作方向和思維路徑,最終生成更深刻、細致和原創的內容。

受此啟發,本文作者提出了 OmniThink,一種新的機器寫作框架,模擬人類迭代擴展和反思的認知過程。

2. 什么是 OmniThink 框架?

OmniThink 的核心思想是模擬學習者在逐漸加深對復雜主題理解時的認知行為,以擴展知識邊界。通過不斷反思之前檢索到的信息,OmniThink 可以確定進一步擴展的最佳步驟。

這種 擴展-反思機制(Expansion Reflection Mechanism) 使得檢索策略能夠動態調整,從而促進對相關信息的更深入和全面的探索。一旦收集到多樣化的信息,OmniThink 將進入大綱構建和文章生成的階段。這種迭代的思維過程最終生成更高質量的文章,其中包含更高密度的有用、深刻和原創的內容。

OmniThink:如何讓 LLM 寫出有更有深度的文章-AI.x社區圖片

如上圖,OmniThink 分為三步:信息獲取、大綱構建和文章撰寫。但是在信息獲取階段,通過擴展和反思形成信息樹和概念池,為后續提綱和文章撰寫奠定基礎。

2.1 信息獲取(Information Acquisition)

OmniThink:如何讓 LLM 寫出有更有深度的文章-AI.x社區圖片

如上圖,擴展和反思的迭代過程最終構建了一個信息樹和一個概念池。

2.1.1 擴展(Expansion)

OmniThink 分析信息樹的所有葉節點,每個節點都會被評估以確定是否需要進一步擴展。

對于需要擴展的節點,OmniThink 使用當前的概念池來確定需要深入擴展的領域或合適的擴展方向

2.1.2 反思(Reflection)

OmniThink 對所有葉子節點中的新信息進行反思。從每個葉子節點提取的信息經過分析、過濾和綜合,提煉出核心見解。這些見解隨后被整合到概念池中,并在整個過程中不斷更新和豐富。

擴展與反思的迭代循環將持續進行,直到 OmniThink 確定已獲取足夠的信息或達到預定義的最大檢索深度。確保獲取的信息是相關、詳細且多樣化的,為生成結構化和信息豐富的文章提供了堅實的基礎。

2.2 大綱構建

大綱是文章的核心,決定了內容方向、結構層次和邏輯推進。要構建一個結構清晰、邏輯連貫的大綱,必須對主題有深入理解。

OmniThink 維護了一個與主題緊密相關的概念池,這代表了 LLM 對主題理解的邊界和深度。

在生成大綱時,首先創建草稿大綱,然后讓 LLM 從概念池中提煉并鏈接內容,最終形成最終大綱。

通過這種方式,LLM 能夠在大綱中全面覆蓋主題要點,并確保文章的邏輯一致性和內容連貫性。

2.3 文章撰寫

完成大綱后,開始為每個部分撰寫內容。

撰寫時,利用部分標題及其子標題,通過計算語義相似度從信息樹中檢索最相關的 K 個文檔。LLM 會根據這些信息生成帶有引用的內容。

所有部分生成后,將被拼接成完整的草稿文章。由于各部分并行生成,其他部分內容尚不明確,會提示 LLM 處理拼接后的文章,刪除冗余信息,最終形成文章。

3. 效果評估方法

通過自動和人工評估相結合的方式來評估生成的長篇文章。

3.1 自動評估

使用 Prometheus 2 對文章進行 0 到 5 分的評分,評估其相關性、廣度、深度和新穎性。還通過信息多樣性和知識密度來衡量信息豐富度。

** 什么是知識密度? **

以往的研究大多關注文章的相關性和正確性,卻忽略了文章的深度。許多生成的文章充斥著冗余信息,與人類的寫作風格相去甚遠。為此,引入了知識密度(KD)的概念,定義為有意義內容與文本總量的比率,公式如下:

OmniThink:如何讓 LLM 寫出有更有深度的文章-AI.x社區圖片

其中,N 是文檔中原子知識單元的總數,U(ki) 表示第 i 個單元信息 ki 是否唯一,L 為文本總長度。分子表示從長篇文章中提取的獨特知識單元總和,分母則是文章的長度。

知識密度的價值在于它能從信息獲取的角度衡量生成文本的閱讀成本。低 KD 內容往往因冗余或不相關細節讓讀者感到疲勞或失去興趣,而高密度內容則能提供簡潔高效的閱讀體驗。

以往的方法在 KD 上表現有限,因為開放域長文本生成依賴于檢索信息。當檢索信息不夠多樣化時,生成的文章往往包含大量重復和冗余內容。這為優化知識密度提供了空間。

3.2 人工評估

隨機選取 20 個主題,將生成的文章與 Co-STORM(基于自動評估的最佳基線)生成的文章進行對比,并在相同的四個方面進行評分。

4. 效果怎么樣?

4.1 自動評估

OmniThink:如何讓 LLM 寫出有更有深度的文章-AI.x社區圖片

上圖展示了使用 GPT-4o 和 Qwen-Plus 作為骨干的評估結果。

在四個關鍵評分標準(相關性、廣度、深度和新穎性)的框架下,OmniThink 在所有方面都表現出色,特別是在新穎性指標上,以 GPT-4o 為骨干時尤為突出。

在知識密度方面,OmniThink 采用了一種連續且動態的檢索策略來收集廣泛的信息,這使其在內容生成階段能夠利用更廣泛的資源。這一戰略優勢使 OmniThink 在知識密度指標上優于現有的基準方法。

從結構合理性、邏輯一致性和生成指導性三個方面評估大綱質量。

OmniThink:如何讓 LLM 寫出有更有深度的文章-AI.x社區圖片

從上圖中可以看出,OmniThink 在結構合理性和邏輯一致性方面表現優異。歸功于 OmniThink 概念池的獨特設計,使 LLMs 在大綱生成過程中對目標主題有更全面和多樣化的理解。

有助于更好地指導內容生產,并增強生成內容的整體結構連貫性。然而,模型的邏輯一致性僅比基線略有改善。

4.2 人工評估

邀請了 15 位高學歷志愿者進行人工評估。

OmniThink:如何讓 LLM 寫出有更有深度的文章-AI.x社區圖片

上圖展示了評估結果,OmniThink 在多個維度上的平均表現均優于當前最強的基線模型,尤其在廣度指標上比 Co-STORM 高出 11%。

然而,在創新性指標上,自動化評估顯示 11% 的提升,但人工評估僅發現微弱優勢。表明當前的自動化評估與人類判斷尚未完全一致,為未來長文本評估的改進提供了方向。

盡管 OmniThink 在多個維度上表現優異,但仍有約 30% 的文章被評估者認為與基線模型不相上下。這可能是因為隨著大模型寫作能力的提升,人類越來越難以察覺細微差異。

5. 消融分析

OmniThink 的核心之一是動態擴展與反思機制。對比了 OmniThink 與其簡化版本(無動態擴展與反思機制)。

OmniThink:如何讓 LLM 寫出有更有深度的文章-AI.x社區圖片

如上圖所示,簡化版在文章質量的多個指標上表現遜色,尤其在信息多樣性和新穎性方面。證明了動態擴展與反思機制在提升信息多樣性和文章新穎性上的重要作用。

5.1 擴展與反思分析

深入探討了擴展和反思過程如何影響最終文章的各個方面及其整體質量。

由于擴展和反思在 OmniThink 中相互依賴,單獨評估它們的影響是不現實的。為此,采用了一種間接但系統的方法來評估它們對文章質量的綜合影響。

在信息獲取階段,用性能較低的模型替換擴展模型,并測量生成文章指標的性能下降,以此作為擴展過程影響的指標。同樣,采用相同的方法評估反思過程的影響。

OmniThink:如何讓 LLM 寫出有更有深度的文章-AI.x社區圖片

持續反思擴展知識邊界:反思在新穎性和信息多樣性方面比擴展更為重要。反思不僅讓模型能夠重新評估和內省現有知識,還能以激發更多樣化和廣泛思想的方式整合信息。這種深度內省過程至關重要,因為它通過多樣化的見解豐富了敘述,為創新和多樣化的寫作奠定了基礎。本質上,反思模塊是創造力的關鍵加速器,使模型能夠超越簡單信息增強的限制,構建出獨特且信息豐富的敘述。

擴展增強知識深度并提高信息相關性:擴展在廣度和深度方面比反思更為重要。因為擴展為模型的后續信息檢索設定了方向。通過為檢索過程建立更精確和有效的方向,模型能夠更好地利用檢索到的信息,并將其無縫整合到文本中,從而以更大的深度和廣度豐富內容。這種整合不僅增強了內容的相關性,還提高了知識密度,使文本更加全面和細致。因此,更好的擴展策略能夠打造出更復雜的規劃者,使其能夠更巧妙地應對信息檢索和利用的復雜性。

5.2 思考深度分析

OmniThink 在提升信息檢索方面進行了多次嘗試,本質上是擴展了檢索信息的規模。

OmniThink:如何讓 LLM 寫出有更有深度的文章-AI.x社區圖片

從上圖可以看到,隨著深度從 1 增至 3,生成文章的知識密度和信息多樣性迅速提升。

隨著深度增加,OmniThink 能夠在網絡上搜索到更多樣化的信息,并將其應用于文章生成。

然而,當深度增至 4 時,知識密度和信息多樣性的增長顯著放緩。這可能是因為該主題的可用信息接近搜索極限,難以檢索到更多有用信息。

6. 局限性

? 當前研究僅涉及搜索和文本生成,開放領域中的大量多模態信息尚未被充分利用。

? 文本生成中未考慮個性化語言風格,導致生成的文本偏向學術化,可能不符合普通用戶的閱讀習慣。

本文轉載自??大語言模型論文跟蹤??,作者:HuggingAGI 

已于2025-1-22 18:31:44修改
收藏
回復
舉報
回復
相關推薦
国产一二三区在线观看| 一区二区三区少妇| 麻豆传媒视频在线观看| 日韩三级精品| 午夜视频一区在线观看| 日韩欧美亚洲日产国| 国产精品无码久久av| 婷婷精品视频| 欧美日韩国产在线播放网站| 僵尸世界大战2 在线播放| wwwxxx在线观看| 国产不卡在线一区| 国产精品国产亚洲伊人久久| 欧美日韩一级在线观看| 精品久久综合| 精品对白一区国产伦| 15—17女人毛片| av资源中文在线| 国产综合久久久久久鬼色| 国模视频一区二区| 国产欧美日韩在线播放| 天天射天天干天天| 国产精品v亚洲精品v日韩精品| 亚洲欧美色图片| 在线观看免费看片| 国产精品久久久久久吹潮| 黄色一区二区在线| 国内精品国产三级国产99| 国产乱理伦片a级在线观看| 国产成人av电影在线观看| 国产狼人综合免费视频| 欧美特黄aaaaaa| 精品av久久久久电影| 日韩一区二区三区视频在线| 99草草国产熟女视频在线| av丝袜在线| 亚洲一区国产视频| 黄色一级片网址| 91se在线| 国产农村妇女精品| 国产精品视频1区| 国语对白永久免费| 亚洲色诱最新| 欧美精品videosex牲欧美| 久久久久久久久久影视| 九九精品调教| 日韩理论片网站| 特级西西444www大精品视频| 巨骚激情综合| 极品销魂美女一区二区三区| 国产精品久久久久久亚洲影视| 亚洲男人的天堂在线视频| 狠狠爱成人网| 欧美国产乱视频| 免费在线视频一区二区| 韩日成人在线| 久久久噜噜噜久久中文字免| 国产一级视频在线播放| 怡红院精品视频在线观看极品| 久99久在线视频| 国产精品九九九九九九| 韩日精品在线| 97精品伊人久久久大香线蕉| 久久黄色精品视频| 久久久久看片| 国产精品久久中文| 国产精品视频在线观看免费| 国产激情视频一区二区在线观看| 亚洲最大福利视频网站| 成人av手机在线| 日日摸夜夜添夜夜添国产精品| 北条麻妃99精品青青久久| 国产黑丝一区二区| 婷婷综合成人| 一个人www欧美| 免费黄色国产视频| 综合在线一区| 97视频在线观看亚洲| 人人爽人人爽人人片av| 美女诱惑一区二区| 成人91免费视频| 污污视频在线免费看| 国产三级欧美三级日产三级99| 91精品啪aⅴ在线观看国产| 99久久精品无免国产免费 | 国产精品另类一区| 日本高清xxxx| 欧美裸体视频| 欧美日韩性生活| 精品人妻二区中文字幕| 免费成人高清在线视频theav| 最近2019中文字幕mv免费看| 久久精品www| 免费看的黄色欧美网站| 成人网在线免费观看| 欧美 日韩 国产 成人 在线 91| xnxx国产精品| 国产欧美自拍视频| 国产精品一区二区av影院萌芽| 欧美猛男男办公室激情| 伊人网综合视频| 久久婷婷蜜乳一本欲蜜臀| 久久久久久久国产| 做爰视频毛片视频| 成人免费av在线| 亚洲欧洲精品一区| 九色蝌蚪在线| 亚洲视频狠狠干| 久久久久久久久久久视频| 成人精品在线| 亚洲天堂男人天堂| 国产在线拍揄自揄拍| 久久99在线观看| 精品1区2区| 中文字幕伦理免费在线视频| 欧美无人高清视频在线观看| 日本三级日本三级日本三级极| 色欧美自拍视频| 一个人看的www久久| 日本视频www| 久久99久久99小草精品免视看| 精品一卡二卡三卡四卡日本乱码| 欧美性天天影视| 一本一本大道香蕉久在线精品 | 午夜精品免费视频| 国产日韩欧美中文字幕| 国产精品网友自拍| 欧美日韩国产精品激情在线播放| 日韩三级网址| 久久亚洲国产精品成人av秋霞| 香蕉污视频在线观看| 92精品国产成人观看免费 | 久久国产高清视频| 日韩vs国产vs欧美| 欧美黑人3p| 美女网站在线看| 亚洲精品在线三区| 久久国产精品波多野结衣| 国产综合久久久久久鬼色 | 96久久精品| 麻豆视频网站在线观看| 欧美日韩国产综合一区二区 | 欧美伊人影院| 成人免费在线网址| 性开放的欧美大片| 欧美日韩国产成人在线91| 亚洲天堂最新地址| 日本美女一区二区| 亚欧洲精品在线视频免费观看| 成年美女黄网站色大片不卡| 精品视频在线播放| 日本视频网站在线观看| 久久久国产精品麻豆| 亚洲国产精品www| 日韩精品第一| 丝袜亚洲欧美日韩综合| 夜夜嗨av禁果av粉嫩avhd| 中文字幕av资源一区| 一女二男3p波多野结衣| 国产国产精品| 亚洲一区二区在线| 欧美日本韩国一区二区| 一本色道久久综合狠狠躁的推荐| 麻豆精品免费视频| 免费一区二区视频| ijzzijzzij亚洲大全| 亚洲开心激情| 午夜精品一区二区三区在线视| 天堂中文在线看| 色噜噜夜夜夜综合网| 波多野结衣欲乱| 国产精品亚洲第一区在线暖暖韩国| 热久久最新网址| 国产精品zjzjzj在线观看| 2020欧美日韩在线视频| wwwww在线观看免费视频| 欧美一区午夜视频在线观看| 久久老司机精品视频| 91偷拍与自偷拍精品| 网站一区二区三区| 欧美一区久久| 免费看成人午夜电影| 欧美一级网址| 久久久免费电影| 国产在线黄色| 日韩午夜av一区| 成年人免费高清视频| 中文字幕亚洲在| 午夜肉伦伦影院| 999久久久精品国产| 国产精品一区二区三区在线| 三级成人黄色影院| 美女福利精品视频| 免费在线超碰| 日韩欧美中文一区二区| 中文字幕在线日本| 亚洲国产wwwccc36天堂| www.色.com| 99精品电影| 国产一区二区无遮挡| 国产亚洲人成a在线v网站| 久久久中精品2020中文| 生活片a∨在线观看| 亚洲高清久久网| 91中文字幕在线视频| 欧美日韩国产在线播放| 私库av在线播放| 中文字幕不卡在线| 免费观看av网站| 国产成人一级电影| 永久免费的av网站| 久久久久久9| 成年人网站国产| 91精品亚洲| 视频一区二区三区免费观看| 美女主播精品视频一二三四| 91色中文字幕| yiren22亚洲综合| 欧美一乱一性一交一视频| 日本三级韩国三级欧美三级| 夜夜嗨av色一区二区不卡| 天堂网www中文在线| 欧美大片在线观看一区| 国产特级aaaaaa大片| 欧美少妇一区二区| 手机av免费观看| 欧美性生交xxxxxdddd| 国产网友自拍视频| 一区二区三区国产精品| 欧美日韩午夜视频| 中文字幕一区二区三区四区不卡| 亚洲AV无码成人精品区明星换面| 91麻豆精东视频| 亚洲成av人片在线观看无| 粉嫩av一区二区三区| 麻豆传媒在线看| 国产一二三精品| 三年中文在线观看免费大全中国| 久久91精品久久久久久秒播| 亚洲少妇久久久| 日韩av午夜在线观看| 欧美日韩大尺度| 视频一区视频二区中文字幕| 成人免费视频久久| 视频一区中文字幕| 奇米影音第四色| 麻豆精品新av中文字幕| 中国黄色片免费看| 国内精品在线播放| 真实乱偷全部视频| 丁香一区二区三区| 黄色性视频网站| 99久久国产综合精品麻豆| 强迫凌虐淫辱の牝奴在线观看| proumb性欧美在线观看| 影音先锋人妻啪啪av资源网站| 99在线精品免费| 亚洲一区二区乱码| 国产网红主播福利一区二区| 天天舔天天操天天干| 亚洲欧美综合色| jizz亚洲少妇| 黄色成人在线免费| 中文天堂在线资源| 性做久久久久久久久| 国产香蕉视频在线| 在线影视一区二区三区| 一级黄色片网站| 精品久久久久99| 亚洲色图 校园春色| 一区二区三区回区在观看免费视频| 91欧美在线视频| 欧美国产日韩在线| 成人香蕉视频| 成人啪啪免费看| 成人午夜三级| 色综合久久av| 午夜久久久久| 免费激情视频在线观看| 国内一区二区视频| 特大黑人巨人吊xxxx| 国产精品色噜噜| 日韩成人高清视频| 欧美三级午夜理伦三级中视频| 国产av无码专区亚洲a∨毛片| 亚洲精品久久久久久久久久久| av在线免费观看网站| 色综合五月天导航| av在线一区不卡| 国产麻豆一区二区三区在线观看| 国产欧美日韩精品一区二区三区| 99精品一级欧美片免费播放| 99国产精品视频免费观看一公开| 国产一二三区av| 粉嫩av亚洲一区二区图片| 亚洲精品成人av久久| 亚洲午夜成aⅴ人片| 91tv国产成人福利| 精品亚洲一区二区三区在线播放| 麻豆免费在线观看| 国产不卡视频在线| 成人福利一区| 国产精品无码乱伦| 日韩精品国产欧美| 国产xxxx视频| 一区二区三区国产精品| 91麻豆一区二区| 亚洲人在线视频| yellow在线观看网址| 亚洲精品女av网站| 成人羞羞网站入口免费| 成人av一级片| 国产成人精品影视| 男人在线观看视频| 欧美日韩美女一区二区| 欧美女同网站| 国内精品模特av私拍在线观看| 国产一区二区三区亚洲综合| 亚洲高清视频在线观看| 久久婷婷一区| 三级男人添奶爽爽爽视频| 一区二区成人在线| aaa国产视频| 日韩亚洲欧美成人| 亚洲毛片在线免费| 一本色道久久综合亚洲二区三区| 久久综合九色综合欧美狠狠| 中文字幕在线播放视频| 亚洲国产日韩一区二区| 精品国自产在线观看| 久久国产精品偷| 日本午夜精品久久久久| 视频在线精品一区| 日韩av二区在线播放| 国产精品揄拍100视频| 精品久久久香蕉免费精品视频| 免费av一级片| 久久久免费精品视频| 精品福利一区| 无码精品a∨在线观看中文| 91亚洲精品久久久蜜桃网站| 日韩av在线天堂| 日韩成人激情视频| 亚洲精品mv| 欧美日韩在线一二三| 奇米888四色在线精品| 日本综合在线观看| 欧美精品免费视频| 超碰人人在线| 国产a一区二区| 中文日韩在线| 久久精品—区二区三区舞蹈| 欧美色综合影院| 日本中文字幕在线2020| 亚洲一区二区三区视频播放| 欧美女激情福利| 中文字幕三级电影| 日韩欧美在线中文字幕| yw193.com尤物在线| 91九色国产视频| 激情欧美国产欧美| 亚洲熟妇无码av| 欧美日韩国产一级片| 国产在线1区| 国产视频99| 日精品一区二区| 三上悠亚作品在线观看| 欧美精品一区二区三区在线播放| 国产乱码午夜在线视频| 天堂社区 天堂综合网 天堂资源最新版 | 国产亚洲一级高清| 婷婷久久免费视频| 久操网在线观看| 国产视频一区二区三区在线观看| 国产精品久久综合青草亚洲AV| 久久久久久国产| 欧美精品一区二区三区精品| 亚洲一级片av| 国产欧美日韩不卡免费| 91资源在线视频| 97在线免费观看视频| 成人三级视频| 欧亚乱熟女一区二区在线| 欧美午夜免费电影| 青草av在线| 日韩精品伦理第一区| 国产精品18久久久久久久久 | 国产深夜精品| 国产精品久久久免费看| 亚洲福利在线视频| 久久女人天堂| 久久精品免费一区二区| 亚洲女同女同女同女同女同69| 天堂网av2014| 成人精品视频99在线观看免费| 在线亚洲精品| 欧美三级免费看| 中文字幕成人精品久久不卡| 欧美三级网址| 欧美一二三不卡|