精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

斯坦福大學:大模型“卷”錯方向了?上下文窗口越長,模型越笨!

人工智能
模型難以利用更長的上下文。僅僅通過增加上下文長度可能無法有效提升語言模型的性能。要真正改善模型處理長上下文的能力,可能需要從模型本身進行改進,例如改進模型的架構或者訓練策略。

在語言模型中,上下文窗口對于理解和生成與特定上下文相關的文本至關重要。

一般而言較大的上下文窗口可以提供更豐富的語義信息、消除歧義。

由于硬件和算法的最新進步,大模型的上下文窗口的長度也越來越“卷”。

其中的卷王當屬Anthropic 公司,其五月份就將 Claude 的上下文窗口從 9k token擴展到了 100k。

最近更新的Claude 2 更是讓其100K的上下文能力“常駐”模型。

圖片圖片

有大模型“風向標”之稱ChatGPT也在三月份將GPT-4模型最大上下文窗口達擴至32K;六月份將GPT-3.5-Turbo增加了16k的上下文長度(此前是4k)。

圖片圖片

而斯坦福大學聯合加州伯克利大學以及Samaya的研究員,在一篇題為“中途迷失:語言模型的長·上下文利用之道”中提出:在多文檔問題回答和鍵值檢索,這兩種都需要從輸入的上下文中識別相關信息的任務中,大語言模型會隨著輸入上下文的長度增加,性能會顯著下降。

具體而言,作者指出當相關信息出現在輸入上下文的開頭或結尾時,性能通常最好,但當模型需要在長篇上下文的中間獲取相關信息時,性能明顯降低。

換句話說:當帶有答案的文字,被放在文章的中間時候,大語言模型可能無法準確識別、理解該答案。

因此,大模型目前越來越卷的上下文窗口長度,可能并不能增加模型的理解能力。

圖片圖片

值得一提的是,知名科技媒體網站VentureBeat也報道了這篇論文,并咨詢了一些專家,表示,向量數據庫可能是破局的關鍵。

Vector databases like Pinecone help developers increase LLM memory by searching for relevant information to pull into the context window.

這一說法也得到了上述論文的關鍵作者“Nelson Liu”的認可,他表示:如果將整個 PDF 放到語言模型上下文窗口中,然后詢問有關該文檔的問題,那么使用向量數據庫搜索通常會更有效。

同時Nelson Liu也提到這篇論文并不是在說將整篇文檔塞進大模型的上下文窗口,就一定表現不好。其實,結果取決于文檔所包含的具體內容,大模型在區分“關系密切的內容”時,表現不佳。當各部分內容不相關(相互獨立)的時候,大模型非常擅長“準確定位”。

編者注:向量數據庫的核心思想是將文本轉換成向量,然后將向量存儲在數據庫中,當用戶輸入問題時,將問題轉換成向量,然后在數據庫中搜索最相似的向量和上下文,最后將文本返回給用戶。

論文細節

論文對開源和非開源的模型都進行了測驗,前者包括MPT-30B-Instruct,LongChat-13B(16K);后者包括OpenAI的GPT-3.5-Turbo和Anthropic的Claude。

首先進行了多文檔問題回答的實驗。該任務的目標是讓模型對文檔進行推理,找到并使用相關信息來回答給定的問題。

在實驗中,對輸入上下文的大小以及輸入上下文中的相關信息位置進行了有控制的調整。

圖片圖片

如上圖所示,當改變相關信息在文檔中的位置時,模型性能呈現獨特的U形趨勢,即當相關信息出現在輸入上下文的開頭或結尾時,性能通常最好;當模型需要在長篇上下文的中間獲取相關信息時,性能明顯最低。

甚至,在相關信息被放在輸入上下文的中間位置時,GPT-3.5-Turbo在多文檔問題回答任務上的表現不如別提供文檔。

此外,一些號稱專門處理長文本的大模型,在這方面表現也不好。

那么,語言模型有多大程度上能從輸入上下文中檢索信息呢?論文作者指定了一個合成的鍵值檢索任務來探索該問題。

在這個任務中,模型需要處理一組JSON格式的鍵值對,并必須返回與特定鍵相關聯的值。類似于多文檔問題回答任務,鍵值檢索任務在操作過程中,也對輸入上下文的大小以及輸入上下文中的相關信息位置進行了有控制的調整。

結果顯示:仍然是U形性能曲線。

多文檔問答

多文檔問答任務在很大程度上類似于商業搜索和問答應用(例如,Bing Chat)所采用的檢索增強生成模式。

在這些實驗中,模型的輸入是一個需要回答的問題,以及k篇文檔(例如,來自維基百科的段落),其中一篇文檔包含了問題的答案,而剩下的k-1篇“干擾”文檔則沒有。

圖片圖片

如上圖所示,要執行多文檔問答任務,模型需要在輸入的上下文中獲取包含答案的文檔,并用它來回答問題。

具體測驗中,作者利用NaturalQuestions基準測試的數據,創建了這一任務的實例。其中,使用的查詢來自于NaturalQuestions-Open,并從維基百科抽取段落(即不超過100個Token的文本塊)作為輸入上下文中的文檔。

對于所有這些查詢,需要找到一份包含答案的文檔,并找到k - 1份沒有答案的文檔作為干擾項。前者作者采用NaturalQuestions注釋中含有答案的維基百科段落;后者采用了Contriever檢索系統找出那些最與問題相關,但并未包含任何NaturalQuestions標注答案的k - 1個維基百科片段。

最后,將準確度作為主要的評價標準,以此來判斷預測輸出中是否出現了正確的答案。

圖片圖片

前期準備工作完畢,作者對當前幾個“最能打”的大模型進行了測驗。從上圖可以看出,這些模型都展示出了U形性能。

圖片圖片

如上圖所示,隨著輸入上下文的增長,模型的表現有明顯的下滑。無論哪一個任務,隨著上下文擴展,模型的功能都會表現出退化。

鍵值檢索任務

鍵值檢索任務能夠測驗大模型從輸入上下文直接獲取信息的能力。鍵值檢索任務中,輸入是含k對鍵值的JSON對象及一特定鍵,目標是返回該鍵關聯的值。

圖片圖片

因此,每個JSON對象都包含一個關聯的鍵值對(需要檢索的值),和k-1個不相關的“干擾”鍵值對。上圖展示了鍵值檢索任務輸入內容和其對應的預期輸出。

該任務中,可通過增加或減少隨機鍵來改變JSON鍵值對的數量,這樣就改變了輸入的長度;同時也會調整輸入中相關的正確信息的位置。

圖片圖片

含有75、140和300個鍵值對的測試

上圖展示了鍵值檢索的表現。結果顯示雖然鍵值找回任務僅需找到輸入上下文中的精確匹配,但并非所有模型都表現優秀。claude模型在各種長度上都接近完美,但其他模型在檢索大量鍵值對時遇到了困難。

在鍵值檢索和多文檔問答任務中,表現出類似的U型曲線。唯一的例外是在鍵值檢索任務中表現出色的模型(claude)。值得一提的是,LongChat-13B在140鍵值環境下的表現非常獨特,它會生成代碼來提取鍵值,而非直接輸出值。

為什么會出現這種問題?

為深入洞察其原因,作者初步研究了模型構架,答案在上下文中位置,和指令調優起到的作用。

圖片圖片

在模型架構層面,論文比較了only解碼器和編碼-解碼兩類模型,結論是:相比于only解碼器的語言模型,編碼器-解碼器結構的語言模型在上下文窗口方面較為穩健。但當模型處理超過其在訓練時使用的最大序列長度時,編碼器-解碼器模型也會出現U形曲線。

另外,更改答案在上下文中的位置,可以完美地提高關鍵-值檢索任務的性能,但對多文檔問答任務的性能趨勢影響不大。

最后,作者發現基礎語言模型在沒有指令調優的情況下也表現出U形曲線,這表明指令調優過程本身可能不是造成這一性能模式的原因。

換句話說,語言模型在利用中間信息上的困難,其根本原因可能不在于指令調優,這需要我們更深入地研究模型本身的結構及訓練過程。

論文結論

提供更多上下文信息并非總是有益的。盡管在某些情況下,向語言模型提供更多的上下文信息可以提高其性能,但是在一定點之后,增加更多的上下文信息可能無法帶來顯著的性能改進。

模型優先使用開頭和末尾信息。語言模型更容易處理輸入信息的開頭和末尾部分,所以把關鍵信息放在這些位置或縮短文檔長度可能有助于提升性能。

模型難以利用更長的上下文。僅僅通過增加上下文長度可能無法有效提升語言模型的性能。要真正改善模型處理長上下文的能力,可能需要從模型本身進行改進,例如改進模型的架構或者訓練策略。

參考文獻:

https://venturebeat.com/ai/stanford-study-challenges-assumptions-about-language-models-larger-context-doesnt-mean-better-understanding/

https://arxiv.org/abs/2307.03172

https://guangzhengli.com/blog/zh/vector-database/

責任編輯:武曉燕 來源: 大數據文摘
相關推薦

2023-07-24 12:27:08

論文斯坦福

2025-10-11 08:52:06

2025-10-13 09:03:00

2018-01-22 16:16:28

AI發展新趨勢機器學習

2023-07-21 14:16:15

2025-10-11 18:05:23

AI智能體模型

2011-11-17 09:53:18

斯坦福大學iOS應用開發

2021-03-18 11:30:15

人工智能AI機器學習

2023-05-08 10:29:17

模型論文

2022-10-13 16:01:38

技術大腦

2023-04-12 15:45:56

人工智能ChatGPT

2009-05-07 08:49:11

鮑爾默斯坦福大學巴茨

2025-10-14 09:54:28

2025-07-28 07:45:36

Anthropic大推理模型LRM

2024-03-14 08:11:45

模型RoPELlama

2020-07-08 16:46:46

人工智能病毒技術

2023-10-22 07:01:29

AI

2025-05-28 11:43:48

多模態大模型RBench-V

2025-02-17 08:25:00

模型數據訓練

2024-12-18 15:02:48

點贊
收藏

51CTO技術棧公眾號

av网站在线观看免费| 亚洲激情图片网| 狂野欧美性猛交xxxxx视频| 国产成人综合亚洲网站| 欧美激情国内偷拍| 人妻熟女aⅴ一区二区三区汇编| 天堂av中文在线观看| 久久午夜老司机| 国产精品美女在线| 欧美 日韩 国产 一区二区三区 | 中文字幕成人网| 国产免费亚洲高清| 国产精品16p| 久草在线成人| 91精品一区二区三区在线观看| 91免费国产精品| 你懂的在线观看| 紧缚奴在线一区二区三区| 久久久亚洲国产| 国产一区二区三区精品在线| 国产精品一区二区美女视频免费看| 亚洲成人免费影院| 亚洲欧美日韩精品久久久| 不卡视频免费在线观看| 久久福利精品| 欧美日韩国产成人| 青娱乐国产视频| 综合中文字幕| 欧美视频在线观看一区| 国产九色porny| 91社区在线观看播放| a美女胸又www黄视频久久| 国产精品女视频| 日韩成人一区二区三区| 91精品在线观看国产| 亚洲人成电影网站色xx| 亚洲熟女一区二区三区| 日韩综合久久| 色呦呦日韩精品| 男人天堂手机在线视频| 麻豆传媒在线免费看| 91免费在线看| 成人看片在线| 一级黄色短视频| 久久天堂精品| 77777少妇光屁股久久一区| 懂色av懂色av粉嫩av| 欧美日韩国产传媒| 亚洲欧美精品suv| 国产精品一区二区无码对白| 免费看一区二区三区| 欧美日韩亚洲丝袜制服| 成人小视频在线看| 亚洲一二三四| 欧美日韩久久久久| 国产婷婷一区二区三区| 青草在线视频| 亚洲免费成人av| 中文字幕欧美人与畜| 91caoporm在线视频| 国产色一区二区| 蜜桃av噜噜一区二区三| 色呦呦视频在线| 成人午夜短视频| 国产成人精品一区二区三区福利| 国产麻豆免费视频| 男女性色大片免费观看一区二区| 欧美在线一区二区视频| 久久久黄色大片| 久久av一区| 日本高清久久天堂| 在线观看污污网站| 青青草精品视频| 国产剧情日韩欧美| 国产精品久久久久久无人区| 精东粉嫩av免费一区二区三区| 成人亲热视频网站| 国产理论片在线观看| 国内精品久久久久影院一蜜桃| 91精品国产综合久久香蕉| 一区二区日韩在线观看| 国产在线麻豆精品观看| y111111国产精品久久婷婷| www.我爱av| 99久久精品99国产精品 | 欧美激情久久久久久久久久久| 精品福利视频一区二区三区| 男男做爰猛烈叫床爽爽小说| 一区二区美女| 中文字幕日韩欧美| 精品无码一区二区三区蜜臀| 一区二区不卡| 久久久久国产精品一区| 毛片毛片女人毛片毛片| 日本最新不卡在线| 成人国产精品日本在线| 国产1区在线观看| 91免费在线播放| 深夜福利成人| 直接在线观看的三级网址| 亚洲成人免费在线| 色婷婷成人在线| 亚洲成人五区| 亚洲精品中文字幕有码专区| 战狼4完整免费观看在线播放版| 91成人国产| 欧美性视频精品| 在线观看免费视频一区| 成人免费视频caoporn| 奇米影视首页 狠狠色丁香婷婷久久综合| 岛国视频免费在线观看| 亚洲日本丝袜连裤袜办公室| 精品视频在线观看一区| 国产成人精选| 亚洲福利视频在线| av在线播放中文字幕| 一区二区亚洲| 国产色综合天天综合网| 天堂网在线资源| 一区视频在线播放| 国产主播在线看| 精品中文字幕一区二区三区四区 | 一区二区三区四区高清视频| 亚洲欧洲在线看| 欧美黄色免费看| 日韩极品在线观看| 国内精品一区二区| 国产黄a三级三级三级av在线看| 欧美日韩综合视频网址| 真实乱偷全部视频| 成人羞羞在线观看网站| 91国内在线视频| www.国产黄色| 国产精品久久久久久久久免费桃花 | 91成人福利| 在线观看欧美日韩| aaa人片在线| 成人午夜激情在线| 黄色a级片免费看| 日本国产一区| 国产亚洲精品一区二555| 日本一本高清视频| 国产不卡免费视频| 特级西西444| 91精品亚洲一区在线观看| 国产一区二区三区在线| 无码人妻熟妇av又粗又大| 99re这里只有精品首页| 免费看国产一级片| silk一区二区三区精品视频 | 天堂成人av| 欧美高清精品3d| 日韩一区二区三区四区视频| 天堂av在线一区| 精品久久久久久亚洲| av中文字幕在线看| 欧美成人aa大片| 免费在线一区二区三区| 国产盗摄女厕一区二区三区 | 欧美精品国产| 97se国产在线视频| 欧美xxxx视频| 欧美成人综合网站| 欧美极品视频在线观看| 国产很黄免费观看久久| 麻豆中文字幕在线观看| 粉嫩一区二区三区在线观看| 久久久97精品| aaa国产视频| 亚洲精品美腿丝袜| 欧美日韩一区二区三区四区五区六区| 欧美精品日韩| 韩国精品一区二区三区六区色诱| 24小时免费看片在线观看| 日韩福利视频在线观看| 久久久久在线视频| 国产精品久久午夜| 日韩在线一区视频| 狠狠综合久久| 黄色国产精品一区二区三区| 欧美男男tv网站在线播放| 亚洲欧美在线一区二区| 做爰无遮挡三级| 成人欧美一区二区三区黑人麻豆| 久久网福利资源网站| 伊人精品在线观看| 在线观看av日韩| av在线不卡顿| 国产日韩欧美成人| а√资源新版在线天堂| 精品国产乱码久久久久久久久| 国产精品theporn动漫| 91亚洲精品久久久蜜桃| 嫩草影院国产精品| 中文字幕亚洲精品乱码| 高清av免费一区中文字幕| 自拍视频在线看| 中文字幕日韩av| 99国产精品99| 午夜精品久久久久久久99水蜜桃 | 性农村xxxxx小树林| 国产精品免费看| 亚洲一区二区三区免费观看| 香蕉大人久久国产成人av| 98精品在线视频| 在线观看美女网站大全免费| 欧美不卡一区二区三区四区| 中文字幕黄色片| 亚洲人成精品久久久久| 添女人荫蒂视频| 国内精品伊人久久久久影院对白| 日韩免费视频播放| 国产精品成人av| 国内视频一区| 精品久久久久久久久久岛国gif| 7777精品久久久久久| 哥也色在线视频| 亚洲日本欧美日韩高观看| www.欧美国产| 精品婷婷伊人一区三区三| 国产真人真事毛片| 国产精品免费视频观看| 三级男人添奶爽爽爽视频 | 中文字幕在线不卡视频| 日韩精品卡通动漫网站| 国产69精品久久久久毛片| 天天色综合社区| 亚洲中字在线| 久久亚洲a v| 久久要要av| 欧美一级二级三级九九九| 这里视频有精品| 成人福利免费观看| 99久久婷婷国产综合精品首页| 韩剧1988在线观看免费完整版| 粗大黑人巨茎大战欧美成人| 国产亚洲激情视频在线| 日韩电影免费| 精品裸体舞一区二区三区| 亚洲天堂中文字幕在线| 在线欧美日韩国产| 国产无套丰满白嫩对白| 午夜精品免费在线| 免费一级全黄少妇性色生活片| 国产精品国产a级| 一区二区黄色片| 成a人片国产精品| 麻豆短视频在线观看| 国产精品一区在线| 99九九精品视频| 国产在线视频一区二区三区| 香蕉视频999| 免费成人在线视频观看| 啊啊啊国产视频| 免费看日韩精品| 亚洲欧美国产日韩综合| 日韩电影一区二区三区四区| 少妇无码av无码专区在线观看| 最新国产拍偷乱拍精品| 丝袜人妻一区二区三区| 悠悠资源网久久精品| av免费观看大全| 99riav1国产精品视频| 国产日韩欧美精品在线观看| 激情久久五月| 日韩欧美国产综合在线| 国产视频久久| 日本在线观看a| 三级精品在线观看| 天天综合网久久| 精品在线播放午夜| 丰满饥渴老女人hd| 波多野结衣中文字幕一区| 熟女丰满老熟女熟妇| 久久久久久久久免费| 国产精品久久免费观看| 1区2区3区国产精品| 久久综合综合久久| 欧美性猛交xxxx富婆弯腰| 波多野结衣视频在线观看| 精品视频999| 99精品久久久久久中文字幕| 精品日韩av一区二区| 欧美另类自拍| 视频在线观看一区二区| av在线免费观看网址| 久久久这里只有精品视频| 中文日产幕无线码一区二区| 国产精品久久久久久av下载红粉 | 999久久久精品一区二区| 国产日韩一区二区| 国产一区二区欧美| 女同性恋一区二区| 9色精品在线| 黄色成人免费看| 国产一区二区91| 日本一区二区在线免费观看| 中文字幕欧美区| 看片网站在线观看| 色婷婷av一区二区三区大白胸| 91中文字幕在线播放| 亚洲国产精品人人爽夜夜爽| 成年人在线观看| 久久久久久成人精品| 网友自拍亚洲| 97se亚洲综合在线| 国产乱码精品一区二区亚洲 | 一级二级三级视频| 亚洲国产福利在线| 欧美成人hd| 欧美一级大片在线观看| 色综合一区二区日本韩国亚洲| 国产精品污www一区二区三区| jvid福利在线一区二区| 免费不卡av在线| 久久精品国产亚洲一区二区三区 | 91色在线porny| 天天鲁一鲁摸一摸爽一爽| 黄网动漫久久久| 国产三级三级在线观看| 亚洲视频在线视频| 17videosex性欧美| 91丝袜美腿美女视频网站| 怕怕欧美视频免费大全| 女人帮男人橹视频播放| 激情综合网最新| 国产又粗又猛又爽视频| 午夜精品久久久久久不卡8050| 99精品在线看| 中文字幕亚洲自拍| 激情都市亚洲| 国产一区二区三区无遮挡| 午夜精品久久久久99热蜜桃导演 | 韩日精品视频| 日本高清一区二区视频| 欧美经典一区二区| 青青视频在线免费观看| 亚洲国产日韩精品在线| 女囚岛在线观看| 亚洲自拍偷拍色片视频| 久久在线视频免费观看| 又色又爽又高潮免费视频国产| 99热精品一区二区| 精品处破女学生| 日韩一区二区三区免费观看| 日本免费在线视频| 国产精品揄拍500视频| 国产一区二区三区四区二区| 丝袜老师办公室里做好紧好爽 | 日韩av二区| 粉嫩虎白女毛片人体| 91在线小视频| 国产成人精品a视频一区| 亚洲高清久久久久久| 91超碰免费在线| 国产精选在线观看91| 亚洲色图欧美| 国产资源中文字幕| 伊人色综合久久天天人手人婷| 国产极品久久久| 欧美精品一二区| 一本一道久久a久久| 欧美一级欧美一级| 91年精品国产| 黄色av一级片| 中文字幕在线日韩| 国产色99精品9i| www.激情网| 波多野结衣视频一区| 在线观看黄网站| 亚洲小视频在线| 99蜜月精品久久91| av电影一区二区三区| 国产福利一区在线| 国产成人一区二区三区影院在线| 日韩电影免费在线观看中文字幕| 成人线上视频| 亚洲精品一区国产精品| 国内久久精品视频| 久久视频免费看| 日韩成人av网址| 91精品店在线| 日本一本草久p| 成人动漫一区二区在线| 欧美精品一二三四区| 中文字幕无线精品亚洲乱码一区 | 日韩av一二区| 在线观看网站黄不卡| 九七电影韩国女主播在线观看| 99精品欧美一区二区三区| 99视频精品| 手机毛片在线观看| 欧美一级二级在线观看| 在线免费三级电影网站| 亚洲一区3d动漫同人无遮挡 | 日韩有码免费视频| 亚洲欧美一区二区在线观看| 韩国av在线免费观看| 国产精品观看在线亚洲人成网| 羞羞答答成人影院www|