精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

北京郵電大學最新研究:使用提示工程解決大模型記憶問題

人工智能 新聞
這項研究為構(gòu)建更強大的智能代理(Intelligent Agent)的記憶模塊提供了關鍵的思路。

北京郵電大學的研究者發(fā)現(xiàn)了一個免訓練的提示技巧,能讓大型語言模型在多輪對話中的推理時間減少73.1%,令牌(tokens)消耗減少59.4%,同時問答準確率還提升了14.1%。

大模型記性差,聊得越久越糊涂

大型語言模型有個軟肋,就是記性不太好,尤其是在連續(xù)進行多輪對話的時候。

你可以把它想象成一個記憶力只有七秒的魚,聊著聊著,就忘了你們最開始在聊什么。它更傾向于記住最近聽到的幾句話,對早先的信息則印象模糊。這在學術(shù)上被稱為“遺忘現(xiàn)象”或“近因偏見”。

這個毛病很要命。因為很多復雜的任務,比如分析一份長長的報告、當一個智能客服、或者做一個需要多步驟推理的問答,都需要模型能記住并整合貫穿整個對話的所有信息。如果它聊到后面忘了前面,那最終的結(jié)論就很可能跑偏,甚至得出完全錯誤的答案。

為了搞清楚這個問題到底有多嚴重,北京郵電大學人工智能學院的研究者設計了兩個非常直接的實驗。

他們用了一個叫HotpotQA的公開數(shù)據(jù)集,這個數(shù)據(jù)集的特點是需要模型閱讀好幾段文字,然后綜合里面的信息才能回答一個問題。

第一個實驗是測試對話長度的影響。研究者把需要模型閱讀的10個段落,分別打包成1輪、5輪和10輪對話發(fā)給模型。也就是說,要么一口氣把所有材料都給它,要么分5次給,要么分10次給。在每一輪,都要求模型篩選出對回答問題有用的關鍵句子。

結(jié)果怎么樣呢?

F1分數(shù)(一個衡量準確率的指標)隨著對話輪數(shù)的增加,穩(wěn)定地往下掉。對話輪次越多,模型表現(xiàn)越差。有趣的是,模型規(guī)模越大,這種性能下降反而越明顯。這說明,雖然更大的模型在單次理解能力上更強,但它們同樣沒能解決在多輪對話中記住歷史上下文這個根本性的挑戰(zhàn)。

第二個實驗更進一步,直接去戳模型的痛點:信息的位置到底有多大影響?

研究者們把回答問題最關鍵的那個段落,有時候放在第一輪對話就告訴模型,有時候則藏到最后一輪才給它。

結(jié)果戲劇性地出現(xiàn)了。

當關鍵信息出現(xiàn)在最后一輪時,模型的性能得分要高得多。這幾乎是無可辯駁的證據(jù),證明了模型存在嚴重的“近因偏見”。它就是更偏愛眼前的信息,對那些“陳年舊事”則不太上心。

目前主流的多輪對話方式存在兩個大問題:第一,模型會忘記早期的輸入;第二,模型很難把不同輪次的信息有效地整合起來進行思考。

不聊歷史,只更新狀態(tài)

傳統(tǒng)的對話方式,就像我們用微信聊天一樣,新的信息不斷附加在舊的聊天記錄后面,整個歷史記錄越來越長。這對計算機來說負擔很重,因為模型每一輪都要把全部歷史記錄再讀一遍,既浪費時間又消耗計算資源。

研究者提出的新策略叫“狀態(tài)更新多輪對話策略”,這個方法非常巧妙,它不需要重新訓練模型,僅僅通過改變給模型提問的方式(也就是提示工程)就解決了問題。

它的核心思想是:別再讓模型背著越來越重的歷史包袱前進了。

在每一輪對話結(jié)束后,我們不保留完整的對話歷史,而是提煉出一個“當前狀態(tài)”,這個狀態(tài)只包含到目前為止所有對解決問題有用的關鍵信息。下一輪對話開始時,我們只需要把新的材料和這個濃縮后的“當前狀態(tài)”一起交給模型就行了。

這個策略主要靠三個技術(shù)組件實現(xiàn)。

第一個叫“狀態(tài)重構(gòu)”(State Reconstruction, SR)。它的作用就是減負。每一輪對話,輸入給模型的信息長度基本是固定的,不會隨著對話輪數(shù)的增加而無限膨脹。因為它包含的不是全部聊天記錄,而是“新的段落”加上“上一輪提煉出的關鍵信息”。

第二個叫“歷史提醒”(History Reminder, HR)。這是整個策略的點睛之筆。通過一個名為“先前選擇”的機制,在每一輪都非常明確地把上一輪篩選出的關鍵句子再次展示給模型。這就像一個秘書在旁邊不停地提醒老板:“老板,別忘了,我們上次開會的核心結(jié)論是這些”。這種方式強制模型必須關注并整合所有跨越時間線的關鍵信息,從而有效對抗遺忘。

第三個是“XML結(jié)構(gòu)化輸出”。為了讓上面兩個機制能自動化地運轉(zhuǎn)起來,模型每次的輸出都必須是標準、規(guī)范的。研究者要求模型把所有找到的關鍵句子,都用一個<info>...</info>這樣的XML標簽包裹起來。這樣,程序就能非常輕松準確地解析出上一輪的結(jié)果,然后用于構(gòu)建下一輪的輸入。

整個對話流程是這樣運作的:

首先,研究者給模型設定一個全局規(guī)則,這個規(guī)則在所有對話輪次中都一樣,寫在系統(tǒng)提示(SYSTEM Prompt)里:

SYSTEM: You are helping to find supporting sentences...
Format your response with <info>...</info>tags. Each response should contain ALL supporting sentences (previous + new ones).

這個提示告訴了模型兩件核心任務:第一,你的回答必須用<info>標簽包起來。第二,你每次回答,都必須包含之前所有輪次找到的關鍵句,再加上當前輪次新找到的關鍵句,是一個累積的過程。

對話開始。

第一輪,用戶提出問題,并給出第一段上下文。

USER: Question: ...Context: {passage 1}
USER: Question: ...
Context: {passage 1}

模型閱讀后,會輸出它認為的關鍵句子,并用<info>標簽包好。

從第二輪開始,“狀態(tài)更新”的魔法就啟動了。用戶會輸入新的文本段落,同時,把上一輪模型輸出的<info>標簽里的內(nèi)容,作為“先前選擇”的歷史提醒,一起發(fā)給模型。

USER:
Question: ...
New Context : {passage k}
USER: Previously selected: {supporting sentences from turn k-1}

程序在每一輪結(jié)束后,自動解析模型輸出的關鍵句子,然后填充到下一輪的“先前選擇”字段里。這個過程循環(huán)往復,直到所有段落都處理完畢。

模型真的記憶變好了嗎?

研究者在三個公開數(shù)據(jù)集上進行了全面的測試,分別是HotpotQA、2WikiMultiHopQA和QASC。前兩個是需要多跳推理的問答數(shù)據(jù)集,非常考驗模型整合信息的能力。

實驗用的模型是Qwen2.5-Instruct系列。

他們把傳統(tǒng)的線性歷史連接方法作為“基線”,用來和新的“狀態(tài)更新”策略進行對比。

首先看性能。

在所有三個數(shù)據(jù)集上,基線方法的性能都隨著對話輪數(shù)的增加而急劇下降,就像我們前面實驗看到的那樣。而狀態(tài)更新策略的表現(xiàn)則非常穩(wěn)健,幾乎不受對話長度的影響。在10輪對話的場景下,新方法的Word F1分數(shù)平均提高了大約10%,由大型語言模型評估的Info Score(信息分數(shù))更是增加了超過1.5分。這證明它確實有效地整合了歷史信息,克服了遺忘問題。

再來看效率,這可以說是最驚人的部分。

表1:主要結(jié)果和消融研究。我們的方法在有效性(Info/QA分數(shù))和效率(時間/令牌)方面均優(yōu)于基線。消融研究證明了HR和SR組件的必要性。(↑:越高越好,↓:越低越好)

在5輪對話中,新方法將總令牌消耗減少了59.4%,推理時間更是減少了73.1%。這意味著過去需要花費100塊錢和1分鐘才能完成的任務,現(xiàn)在只需要花40塊錢和不到20秒就能搞定。這個效率提升是巨大的,因為它避免了每一輪都重復處理冗長的歷史記錄。

研究者還測試了新方法在不同尺寸模型上的普適性。

結(jié)果顯示,無論是30億參數(shù)的小模型,還是140億參數(shù)的大模型,狀態(tài)更新策略都穩(wěn)定地優(yōu)于傳統(tǒng)方法。這說明這個策略的改進是根本性的,不是碰巧在某個特定設置下才有效。

更重要的是,這種高效的信息過濾能力,直接轉(zhuǎn)化為了下游任務的更優(yōu)表現(xiàn)。在篩選出關鍵信息后,模型最終回答問題的得分(QA Score)也比基線方法高出了14.1%。這證明了通過狀態(tài)更新保留下來的信息,不僅緊湊高效,而且對于完成復雜的推理任務極具價值。

為了驗證這個策略設計的合理性,研究者還做了消融研究,也就是把策略的核心組件一個個拿掉,看看會發(fā)生什么。

當把“狀態(tài)重構(gòu)”(SR)模塊去掉后(無SR),整個系統(tǒng)的效率瞬間掉到和基線差不多的水平,證明了SR在壓縮上下文、提升效率方面的核心作用。

而當把“歷史提醒”(HR)模塊去掉后(無HR),性能則出現(xiàn)了災難性的下滑,信息分數(shù)從6.91暴跌至3.74,問答分數(shù)也從7.22降到了4.68。這個結(jié)果強有力地證明了,歷史提醒機制才是跨輪次推理和上下文理解的基石。

結(jié)論很明確:狀態(tài)重構(gòu)(SR)保證了效率,歷史提醒(HR)驅(qū)動了性能,兩個組件缺一不可。

應用前景廣闊

任何需要和用戶進行長時間、多輪次交流的系統(tǒng),都能從中受益。

比如智能客服。它可以幫助客服機器人更好地記住用戶之前提到的所有問題和細節(jié),避免讓用戶重復描述,從而提供更精準、更連貫的服務。

比如在線教育。一個AI輔導老師可以用這個策略來持續(xù)跟蹤學生的學習進度和歷史提問,形成一個動態(tài)更新的“學生狀態(tài)”,從而提供更有針對性的個性化指導。

這項技術(shù)也可能為檢索增強生成(Retrieval-Augmented Generation, RAG)技術(shù)帶來新的可能性。RAG系統(tǒng)通過從外部數(shù)據(jù)庫檢索信息來提升回答的準確性,但如果檢索到的信息很多,如何讓模型有效消化并記住這些信息,同樣是個挑戰(zhàn)。狀態(tài)更新策略可以幫助RAG系統(tǒng)更高效地管理和利用檢索到的知識。

長遠來看,這項研究為構(gòu)建更強大的智能代理(Intelligent Agent)的記憶模塊提供了關鍵的思路。智能代理需要維護一個關于世界和自身任務的內(nèi)部狀態(tài),并根據(jù)新的信息不斷更新。狀態(tài)更新策略,本質(zhì)上就是一種高效、明確的狀態(tài)管理機制。

下次當你發(fā)現(xiàn)大模型開始胡言亂語時,是不是也該考慮幫它“更新”一下狀態(tài)了?

責任編輯:張燕妮 來源: AIGC開放社區(qū)
相關推薦

2013-07-23 18:22:50

Aruba校園網(wǎng)WLAN

2019-06-12 11:59:58

華為

2010-08-24 11:28:26

2017-03-23 14:58:00

互聯(lián)網(wǎng)

2010-06-10 23:25:44

IP-Lab郵電大學Juniper Net

2015-08-03 10:56:59

2009-04-02 10:13:00

視頻會議會議系統(tǒng)建設

2025-05-06 08:40:00

2023-05-04 07:39:14

圖神經(jīng)網(wǎng)絡GNN

2025-07-04 08:42:00

2024-01-22 07:08:00

2012-11-08 00:39:14

軟件定義網(wǎng)絡SDN

2025-04-22 08:56:14

2025-03-12 09:35:45

2021-09-06 10:17:39

算法視頻技術(shù)

2012-06-11 14:48:13

IPv6

2019-06-11 14:52:46

2009-09-25 15:05:51

信息化管理

2012-08-01 14:48:09

信息化
點贊
收藏

51CTO技術(shù)棧公眾號

亚洲性xxxx| 色综合中文字幕国产| 成人高清在线观看| 你懂的国产在线| 成人羞羞视频在线看网址| 91麻豆精品国产自产在线观看一区 | 不卡一二三区首页| 亚洲色图在线观看| 91丝袜超薄交口足| 色是在线视频| 椎名由奈av一区二区三区| 国产美女99p| 中国一级特黄视频| 亚洲国产高清视频| 日韩在线视频观看正片免费网站| 国内自拍第二页| 日韩欧美精品一区二区三区| 国产精品传媒视频| 久久久综合亚洲91久久98| 国产又粗又猛视频免费| 国产欧美精品| 精品自在线视频| 免费黄色在线网址| 日韩高清一级| 日韩欧美国产wwwww| 久久久国产欧美| av剧情在线观看| 中文字幕一区二区在线观看| 美女被啪啪一区二区| 亚洲成人一级片| 韩国毛片一区二区三区| 欧美一区二区三区免费视| 青青操视频在线播放| 日韩精品1区| 亚洲天堂色网站| 少妇被狂c下部羞羞漫画| 日韩久久一区| 欧美日韩国产免费一区二区| 久久国产乱子伦免费精品| 丰乳肥臀在线| 亚洲综合在线视频| 亚洲小视频在线播放| 日本在线观看www| 国产欧美在线观看一区| 久久久婷婷一区二区三区不卡| 亚洲精品免费在线观看视频| 国产精品自在在线| 亚洲r级在线观看| 国产又色又爽又黄又免费| 日韩制服丝袜先锋影音| 国产精品扒开腿做| 69亚洲精品久久久蜜桃小说| 国产日韩一区二区三区在线播放 | 搜索黄色一级片| 97人人精品| 啊v视频在线一区二区三区| 国产极品视频在线观看| 欧美精品尤物在线观看| 亚洲性xxxx| 国产又粗又长又黄的视频| 日韩精品中文字幕第1页| 日韩在线视频一区| 亚洲波多野结衣| 欧美/亚洲一区| 欧美黑人极品猛少妇色xxxxx| 久久97人妻无码一区二区三区| 欧美午夜久久| 97高清免费视频| av资源免费观看| 性色一区二区三区| 国产成人综合一区二区三区| 中文字幕日本视频| 美国欧美日韩国产在线播放| 我不卡伦不卡影院| 91麻豆精品国产| 绯色av蜜臀vs少妇| 乱亲女h秽乱长久久久| 亚洲毛茸茸少妇高潮呻吟| 久久久久无码精品国产sm果冻| 成人羞羞视频播放网站| 久久影视免费观看| 日本在线观看视频网站| 久久免费国产| 亚洲a中文字幕| 天天综合在线视频| 中文字幕第一区二区| 久久天天东北熟女毛茸茸| 国产美女高潮在线| 欧美综合欧美视频| 精品无码av一区二区三区不卡| 久久国产精品免费精品3p| 亚洲性无码av在线| 亚洲天堂黄色片| 欧美亚洲在线| 91久久嫩草影院一区二区| 亚洲男女视频在线观看| 久久久99久久| 一二三在线视频| 日韩电影大全网站| 日韩欧美久久久| 久久久久久久久福利| 欧美区日韩区| 国产精品偷伦视频免费观看国产| 精品人妻无码一区二区三区蜜桃一| 97精品国产露脸对白| 亚洲欧美久久234| 7777kkk亚洲综合欧美网站| 欧美日精品一区视频| 天天躁日日躁狠狠躁av| 久久综合av| 欧美一级电影在线| 精品国产av一区二区三区| 国产视频一区在线播放| av在线免费观看国产| 国产福利91精品一区二区| 亚洲大胆人体av| 在线观看成人毛片| 日本色综合中文字幕| 国产综合欧美在线看| 成人影欧美片| 欧美日韩中文国产| 少妇真人直播免费视频| 狠狠爱综合网| 亚洲一区二区三区久久 | 狠狠精品干练久久久无码中文字幕 | 日韩精品av| 91精品国产综合久久久久久漫画 | 青青操综合网| 欧美人成在线视频| 国产精品无码白浆高潮| 日本一区二区视频在线| 日本精品www| 欧美激情极品| 午夜精品免费视频| 性一交一乱一伧老太| 亚洲欧美综合另类在线卡通| 国产三级三级三级看三级| 婷婷成人影院| 97人人爽人人喊人人模波多| 国产高清第一页| 一区在线播放视频| 中日韩av在线播放| 99久久久国产精品美女| 国产精品毛片a∨一区二区三区|国 | 狠色狠色综合久久| 91国产丝袜在线放| av网站大全在线| 91精品国产品国语在线不卡| 免费观看特级毛片| 国内精品伊人久久久久av影院| 神马影院一区二区三区| 成人免费网站www网站高清| 亚洲人成人99网站| 天堂网一区二区| 国产日韩欧美在线一区| 美女黄色片视频| 成人国产精品一级毛片视频| 国产精品视频一区二区三区四| 国产视频精选在线| 欧美色区777第一页| 久久久久久成人网| 国产一区福利在线| 日本国产中文字幕| 精品三级在线观看视频| 欧美亚洲午夜视频在线观看| 日本黄在线观看| 欧美中文字幕一区二区三区 | 欧美日韩激情| 国产精选久久久久久| 97影院秋霞午夜在线观看| 日韩欧美第一区| 国产无码精品视频| 久久蜜桃av一区精品变态类天堂 | 亚洲奶大毛多的老太婆| 波多野结衣理论片| 中文字幕在线观看一区二区| 伊人免费视频二| 亚洲人成在线影院| 日本在线视频不卡| 国产精品亚洲综合在线观看| 午夜精品久久久久久99热| 精品乱码一区二区三四区视频| 欧美中文字幕一区二区三区亚洲| 乱h高h女3p含苞待放| 成人99免费视频| 男操女免费网站| 欧美激情亚洲| 日本精品一区二区| 欧美经典影片视频网站| 欧美主播福利视频| 久cao在线| 日韩av中文字幕在线| 亚洲综合免费视频| 亚洲国产精品一区二区www在线| 青青草视频成人| 国产乱子伦一区二区三区国色天香| 大伊香蕉精品视频在线| 区一区二视频| 九九九九九精品| 国产区一区二| 国产a∨精品一区二区三区不卡| 成人在线免费看片| 国产亚洲xxx| 欧美特级特黄aaaaaa在线看| 欧美午夜在线观看| 国产午夜在线播放| 亚洲精品你懂的| 成人精品在线观看视频| 国产精品亚洲一区二区三区妖精| 日韩精品一区二区三区不卡| 欧美在线播放| 亚洲一区精彩视频| 宅男在线一区| 国产欧美日韩一区二区三区| 爱情电影网av一区二区| 国产成人精品电影久久久| 后进极品白嫩翘臀在线播放| 色婷婷**av毛片一区| 黄色软件在线观看| 日韩av一区在线观看| 国产一区二区三区三州| 欧洲人成人精品| 国产欧美一区二区三区在线看蜜臂| 依依成人精品视频| 登山的目的在线| 欧美国产精品v| 制服 丝袜 综合 日韩 欧美| 成人国产精品视频| 国产一精品一aⅴ一免费| 久久99久久99精品免视看婷婷| 蜜臀视频一区二区三区| 国产欧美日本| 你懂的av在线| 亚洲欧洲一级| 欧美啪啪免费视频| 亚洲青涩在线| www在线观看免费| 亚洲人成久久| 91专区在线观看| 亚洲国产综合在线看不卡| 亚洲国产精品无码观看久久| 亚洲精品一区二区在线看| 一道精品一区二区三区| 成人一二三区| 亚洲午夜精品福利| 日韩中文欧美| 亚洲成年人专区| 婷婷综合五月| 中文字幕の友人北条麻妃| 欧美在线日韩| av网站手机在线观看| 亚洲一级特黄| 无码精品a∨在线观看中文| 国产精品久久久久毛片大屁完整版| 青青草精品视频在线| 一本色道88久久加勒比精品| 久久国产成人精品国产成人亚洲| 免费在线亚洲欧美| 欧美成人免费高清视频| 青青草国产成人99久久| 天天干天天操天天做| 国产一区二区三区香蕉 | 蜜桃精品视频| 国产成人免费电影| 日本成人a网站| 欧美激情视频一区二区三区| 欧美精品一区二区三区中文字幕| 一区二区在线中文字幕电影视频| 中文字幕亚洲精品乱码| 日韩久久久久久久久久久久| 一区二区三区国产盗摄| 国产成人av影视| 久久se精品一区二区| 亚洲成人激情小说| 91免费在线视频观看| 国产精品理论在线| 一区二区三区在线观看动漫| 日产精品久久久久久久| 在线观看日韩精品| www.成人精品| 亚洲精品一区久久久久久| 三区四区电影在线观看| 欧美日韩成人在线观看| 伊人久久在线| 69174成人网| 精品中文一区| 99re8这里只有精品| 性高湖久久久久久久久| 日韩va在线观看| 99re这里都是精品| 久久人妻无码aⅴ毛片a片app | 欧美成人精品免费| 日本女人一区二区三区| ass极品水嫩小美女ass| 国产亚洲一二三区| 国产精品 欧美激情| 91成人在线免费观看| 国产男男gay体育生白袜| 亚洲毛片在线看| 欧美videosex性极品hd| 国产精品成人观看视频国产奇米| 伊人久久大香线蕉av超碰| 日本精品一区二区三区高清 久久 日本精品一区二区三区不卡无字幕 | 午夜精品久久久久久99热| 国产伊人久久| 久久精品日产第一区二区三区乱码 | 大片免费在线观看| 欧美一乱一性一交一视频| 久久伦理中文字幕| 色中色综合成人| 99精品视频免费全部在线| 色偷偷中文字幕| 欧美国产精品中文字幕| 久久99精品波多结衣一区| 在线综合视频播放| av资源在线观看免费高清| 91精品国产九九九久久久亚洲| 国产专区精品| 亚洲精品国产一区| 久久资源在线| 亚洲精品视频大全| 亚洲大片免费看| xxxx国产精品| 久久久精品在线| 欧美激情不卡| 色噜噜狠狠色综合网| 亚洲综合电影一区二区三区| 精品无码人妻少妇久久久久久| 亚洲欧美日韩久久精品| 中文字幕av影视| 亚洲一区第一页| 高清av不卡| 麻豆精品传媒视频| 亚洲欧美日韩专区| 青青草视频播放| 精品久久久久久电影| 欧美在线 | 亚洲| 久久露脸国产精品| 成人在线视频你懂的| 99er在线视频| 成人动漫中文字幕| 欧美不卡视频在线观看| 亚洲大尺度美女在线| 538在线观看| 国产一区二区免费电影| 亚洲视频成人| 亚洲激情视频小说| 91官网在线观看| 波多野结衣在线影院| 国产99在线|中文| 久久精品国产亚洲夜色av网站| www午夜视频| 亚洲日本一区二区三区| av中文字幕免费| 欧美高清视频在线| 麻豆成人入口| 韩国一区二区av| 中文乱码免费一区二区| 91久久国语露脸精品国产高跟| 少妇久久久久久| 欧美成年网站| 国产一二三在线视频| 久久久午夜精品理论片中文字幕| 久草视频一区二区| 日韩在线免费视频观看| 亚洲日本va午夜在线电影| 777av视频| 欧美韩国一区二区| 国产乱码一区二区| 久久久久国产视频| 国产成人一区| 99久久99精品| 性欧美疯狂xxxxbbbb| 黄网在线免费| 亚洲综合中文字幕在线观看| 亚洲乱码久久| 免费黄在线观看| 日韩欧美第一区| 日韩av超清在线观看| 国产又大又长又粗又黄| 不卡免费追剧大全电视剧网站| 波多野结衣mp4| 欧美日本亚洲视频| 九九精品久久| 黑人无套内谢中国美女| 黑人巨大精品欧美一区二区| 9色在线视频网站| 电影午夜精品一区二区三区| 久久久久中文| 久久中文免费视频| 亚洲免费视频观看| 99国内精品久久久久| 国产视频一视频二| 亚洲情趣在线观看| 丝袜视频国产在线播放| 成人性生交大片免费看视频直播| 亚洲国产一区二区三区a毛片| 国产又黄又粗的视频| 精品免费国产二区三区 | 91九色露脸|