精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

別再信「百萬 token」了,我們扒了 18 個大模型,發現長文本的驚天秘密 精華

發布于 2025-7-22 06:51
瀏覽
0收藏

近些年,大模型圈子最火的詞莫過于「百萬 token 上下文」。

從 Google Gemini 1.5 Pro 到 GPT-4.1,再到 Llama 4,各大廠商仿佛在一場技術軍備競賽中,瘋狂地把模型的「內存」撐大。這讓你我這樣的普通用戶興奮不已:這不就意味著,我可以直接把一整本書、幾百頁的財報、甚至是整個項目代碼庫扔給 AI,讓它瞬間消化,然后對答如流嗎?

理論上是這樣。而且,在經典的 NIAH (Needle in a Haystack,即「大海撈針」) 測試中,這些模型也確實表現得像個超級學霸,幾乎每次都能精準地從海量文本中找到那根「針」。

但是,先別急著開香檳。 ??

最近,一篇“魔鬼級”的深度研究報告,把市面上 18 個主流大模型(包括你熟悉的所有明星產品)拉過來,進行了一場前所未有的長文本「極限施壓測試」。

結論非常顛覆:所謂「長文本能力」,遠比我們想象的要脆弱。

簡單來說,當任務稍微變得復雜一點,這些 AI 天才們的表現,就像是坐上了過山車,一路往下掉。??

「大海撈針」測試,其實是個「偽學霸」鑒定器?

你可能要問,經典的「大海撈針」測試不是證明它們很強嗎?

沒錯,NIAH 測試就是在一大堆無關文字(草堆)里,藏一句關鍵信息(針),然后讓 AI 找出來。

這就像是開卷考試,讓你在書里找原話,AI 當然能拿滿分。但這篇研究一針見血地指出:真實世界的問題,從來都不是找原話那么簡單。

于是,研究團隊設計了一系列“進階版”測試,只為了回答一個問題:當輸入的文本越來越長,AI 的“智商”到底會不會下降?

四場極限挑戰,AI 的“人設”崩了

研究者們設計了四種極其巧妙的玩法,把 AI 的長文本能力扒了個底朝天。

1. 問題越繞,模型越懵 

如果問題和答案不是簡單的「復制粘貼」,而是需要 AI 稍微“拐個彎”去理解呢?

研究團隊設計了不同語義相似度的問題和「針」。結果發現,當問題和答案的字面意思差別越大,AI 的表現就越差。上下文越長,這種性能衰退就越嚴重。

A 君說:這就像你讓朋友去書架上幫你拿「那本藍色的書」,他很容易找到。但如果你說「幫我拿那本講星際旅行的科幻經典」,他可能就要在書架前懵圈半天了。

2. 扔幾個「煙霧彈」,AI 立刻“叛變”

真實世界里,信息往往不是非黑即白,總有很多模棱兩可的“干擾項”。

研究者在「草堆」里,除了藏著真正的「針」,還放了幾個和「針」長得很像,但卻是錯誤的「煙霧彈」(Distractors)。

結果你猜怎么著?

哪怕只放一個「煙霧彈」,AI 的準確率就開始下降。放四個,性能直接“跳水”。而且,文本越長,AI 就越容易被帶跑偏。

更有趣的是,不同模型的“性格”也暴露無遺:

  • 保守派 Claude遇到不確定的情況,它會非常誠實地說:「對不起,信息太模糊,我找不到答案。」(雖然沒答對,但至少沒騙你)
  • 頭鐵幻覺派 GPT它總是那么自信,哪怕是被「煙霧彈」騙了,也會理直氣壯地給出一個錯誤答案。(最怕的就是這種)

3. 文本太“和諧”,反而找不到重點?

如果「針」的內容和「草堆」的背景文章主題非常相似,AI 是更容易找到,還是更難?

實驗結果有點出乎意料,沒有統一的規律。有時候,「針」和背景文章格格不入(比如在技術論文里藏一句寫詩的技巧),AI 反而更容易發現它。

A 君說:這說明 AI 處理的上下文并非“中性填充物”,內容本身會影響它的判斷力。

4. 最反直覺的發現來了:打亂順序,成績反而更好?!

這是整篇報告中最騷,也最讓人大跌眼鏡的發現。

研究者把「草堆」文章的句子全部打亂,破壞了原文的邏輯和連貫性。按理說,這應該會加大 AI 的處理難度吧?

結果恰恰相反!

幾乎所有模型,在處理這些“被打亂的、不講邏輯”的文本時,表現都比處理原文時更好。

為什么?研究者推測,可能是連貫的文本結構以某種方式“催眠”了 AI 的注意力機制,讓它順著邏輯流“飄”了過去,反而忽略了插入其中的「針」。而混亂的文本,則迫使 AI 對每一句話都進行獨立審查,更容易發現異常。

真實世界模擬:AI 的記憶力只有七秒?

除了「大海撈針」,研究者還模擬了兩個真實場景。

場景一:長對話聊天

讓 AI 記住長達十幾萬字的聊天記錄,然后回答一個關于其中細節的問題。同時設置了一個對比組,只給 AI 看了包含答案的那一小段話。

結果毫無懸念:所有模型在只看“重點摘要”時都是學霸,但一旦面對完整的“聊天史”,成績立刻一落千丈。

場景二:「復讀機」任務

這是一個看似無腦的任務:讓 AI 精確地復制一段超長的、由同一個詞組成的文本,比如「蘋果 蘋果 蘋果...」,其中只有一個詞被換成了「香蕉」。

這考驗的是 AI 在長輸入、長輸出任務下的穩定性和精確性。

結果,AI 們的表現簡直是大型翻車現場:

  • 有的直接罷工,拒絕回答。
  • 有的復讀到一半,就開始胡言亂語。
  • 還有的干脆把那個唯一的「香蕉」給忘了,或者放錯了位置。

▲ 隨著文本變長,Gemini 的表現越來越不穩定

A 君說:這說明,別說讓 AI 理解長文本了,有時候,讓它原封不動地“搬運”長文本都做不到。

寫在最后:別迷信參數,要敬畏「上下文」

這項研究給我們所有 AI 用戶和開發者敲響了警鐘。

「百萬 token」的上下文窗口固然是了不起的技術進步,但它絕不等于模型就能完美地利用這些信息。AI 的長文本能力,目前還是一個脆弱、不穩定且充滿未知的領域。

這給我們帶來了最重要的啟示——「上下文工程」 (Context Engineering) 的時代來了。


對于開發者和重度用戶來說,成功的關鍵不再是簡單粗暴地把所有信息都「喂」給 AI。而是要像一位高明的導演,精心設計信息在上下文中的呈現方式

  • 關鍵信息應該放在哪里?(研究表明開頭和結尾效果最好)
  • 如何減少干擾信息?
  • 如何構建提示詞(Prompt)才能讓 AI 更容易理解?

下一次,當你發現你的 AI 在處理長文檔時胡說八道,別急著罵它“人工智障”。

想想看,是不是你給它的“劇本”,還不夠好???

原文地址:???https://research.trychroma.com/context-rot??

本文轉載自???????草臺AI???????,作者:RangerEX

收藏
回復
舉報
回復
相關推薦
一区国产精品视频| 色又黄又爽网站www久久| av资源站久久亚洲| 可以免费在线观看的av| 色999日韩| 精品欧美久久久| 成人黄色片视频| 黄a在线观看| 972aa.com艺术欧美| 国产精品久久久久久久美男| 日本青青草视频| 女厕嘘嘘一区二区在线播放 | 女人帮男人橹视频播放| 青青草免费在线视频| 精品一区二区三区在线播放| 性日韩欧美在线视频| 992在线观看| 网友自拍一区| 在线日韩av片| 男女猛烈激情xx00免费视频| 尤物视频在线免费观看| 99亚偷拍自图区亚洲| 亚洲精品免费av| 伊人久久中文字幕| 日韩视频三区| 美女性感视频久久久| 亚洲欧美va天堂人熟伦| 欧美sss在线视频| 制服丝袜亚洲播放| 中文字幕视频在线免费观看| 日本黄色免费在线| 一区二区三区欧美| 中文字幕av久久| 不卡在线视频| 久久综合国产精品| 国产一区二区三区高清| 国产人妖在线播放| 久久99精品国产麻豆婷婷洗澡| 日本精品免费一区二区三区| 日韩精品乱码久久久久久| 亚洲国产精品综合久久久 | 我不卡伦不卡影院| 深夜福利日韩在线看| 国产精品毛片一区二区| 欧美人妖视频| 日韩精品在线视频美女| 熟妇高潮一区二区| 色妞ww精品视频7777| 欧美一区二区在线视频| 日本中文字幕二区| 亚洲欧洲一二区| 欧美日韩aaaaaa| 国产又大又黄又粗又爽| 成人18视频在线观看| 欧美中文字幕久久| 国产小视频精品| 亚洲成人va| 欧美艳星brazzers| 日韩欧美国产片| 黄色精品视频网站| 3d动漫精品啪啪一区二区竹菊| 蜜臀av免费观看| 四虎国产精品免费久久5151| 欧美精品日韩精品| 亚洲在线观看网站| 亚洲天堂中文字幕在线观看| 亚洲精品在线观| 色天使在线视频| 亚洲另类春色校园小说| 亚洲网站在线观看| 久久久久麻豆v国产| 欧美精品国产| 97视频在线观看免费| 日本中文字幕在线| 美腿丝袜亚洲综合| 亚洲最大福利视频网| 高清乱码毛片入口| 久久人人爽人人爽| 亚洲一区二区精品在线观看| 超碰最新在线| 五月激情综合婷婷| 色乱码一区二区三区在线| www.欧美| 日韩成人网免费视频| 天天干天天舔天天操| 久久久久久影院| 午夜精品视频在线| 中文字幕av网站| 国产91精品欧美| 欧美日韩三区四区| 毛片av在线| 偷拍亚洲欧洲综合| 奇米视频888| 国内精品麻豆美女在线播放视频| 亚洲欧美成人网| 日韩三级久久久| 亚洲精品a级片| 国内外成人免费激情在线视频网站| 久久黄色精品视频| 国产毛片精品视频| 欧美日韩高清在线一区| 成人片在线看| 欧美色另类天堂2015| 国产三级精品三级在线| 美女网站色精品尤物极品姐弟| 亚洲四色影视在线观看| 国产成人av免费在线观看| 一本色道88久久加勒比精品| 91精品国产自产在线老师啪| 欧美一区二不卡视频| 国产精品视频一二| 欧美视频在线播放一区| 欧美精品三级在线| 在线电影中文日韩| 国产成人免费观看视频 | 国产鲁鲁视频在线观看免费| 亚洲综合在线观看视频| 亚洲一区在线不卡| 欧美午夜寂寞| 欧美激情视频给我| 国产精品久久久久久久一区二区| 久久综合色天天久久综合图片| 成人在线观看www| 国产69精品久久久久9999人| 日韩经典第一页| 久久激情免费视频| 国产老肥熟一区二区三区| 亚洲a∨一区二区三区| 咪咪网在线视频| 欧美一级二级三级蜜桃| 女教师淫辱の教室蜜臀av软件| 先锋影音国产一区| 国产一区国产精品| 污污的网站在线看| 91精品久久久久久蜜臀| 最新日韩免费视频| 日韩av不卡在线观看| 麻豆亚洲一区| 蜜桃视频在线观看播放| 亚洲精品www| 日韩乱码在线观看| 成人小视频在线| 国产精品三级一区二区| 日本亚洲视频| 色在人av网站天堂精品| av免费在线观看不卡| 亚洲色图另类专区| 亚洲无在线观看| 91久久电影| 亚洲一区二区三区久久| av在线导航| 日韩欧美国产综合在线一区二区三区| 免费在线观看黄色小视频| 国产一区二区福利| 日本老太婆做爰视频| 久久久91麻豆精品国产一区| 欧美久久久精品| 高h放荡受浪受bl| 偷拍一区二区三区四区| 在线不卡av电影| 日本大胆欧美人术艺术动态| 中文字幕欧美日韩一区二区| 亚洲视频资源| 欧美疯狂xxxx大交乱88av| 国产91免费看| 红桃av永久久久| xxx在线播放| 老司机免费视频一区二区三区| 亚洲欧美久久234| 99久热在线精品视频观看| 久久亚洲综合国产精品99麻豆精品福利 | 欧美激情第10页| 国产精品毛片va一区二区三区| av资源在线播放| 亚洲欧美在线免费观看| 亚洲性在线观看| 亚洲国产综合人成综合网站| 国产又粗又猛又色| 日韩va欧美va亚洲va久久| 亚洲综合激情五月| 国产精品男女| 国产精品欧美日韩久久| 中文字幕免费高清电视剧网站在线观看 | 97不卡在线视频| 韩国福利在线| 欧美一级专区免费大片| 亚洲一区欧美在线| 国产精品视频一区二区三区不卡| 国产精品一级无码| 久久综合九色| 日本a级片在线观看| 欧美中文一区| 国产一区二区色| 僵尸再翻生在线观看| 最近2019中文免费高清视频观看www99 | 日本人亚洲人jjzzjjz| 国产精品一区二区三区四区| 亚洲中文字幕无码专区| 99久久影视| 快播日韩欧美| 日韩精品一区二区三区中文在线| 欧美一区视频在线| v片在线观看| 国产亚洲欧美一区| 亚洲成人77777| 欧美日韩免费一区二区三区| 五月天婷婷综合网| 亚洲欧美国产高清| 国产精品国产三级国产专业不| 国产成a人亚洲| 天美星空大象mv在线观看视频| 精品动漫一区| 中文字幕不卡每日更新1区2区| 曰本一区二区三区视频| 99久久伊人精品影院| 九九热这里有精品| 国产成人aa精品一区在线播放| 精品精品导航| 久久影视电视剧免费网站| 国产系列在线观看| 日韩电影中文字幕av| 午夜久久久久久久久久| 欧美老女人在线| 精产国品一区二区| 偷窥国产亚洲免费视频| 在线免费日韩av| 亚洲色大成网站www久久九九| 玖玖爱在线观看| bt欧美亚洲午夜电影天堂| 91香蕉国产线在线观看| 美女视频一区二区| 老头吃奶性行交视频| 国产欧美高清| 日本欧美视频在线观看| 欧美日本一区| 日韩a级黄色片| 97精品国产福利一区二区三区| 色一情一乱一伦一区二区三欧美| 香蕉视频一区| 蜜桃久久精品乱码一区二区| 日本妇女一区| 久久涩涩网站| 亚洲综合福利| 欧美日韩国产免费一区二区三区| 亚洲人亚洲人色久| 久久精品国产99精品国产亚洲性色| 国偷自产av一区二区三区| 国产成人看片| 国语一区二区三区| 久久99精品久久久久子伦| 欧美激情久久久久久久久久久| 精品欧美国产一区二区三区不卡| 麻豆精品少妇| 欧美高清性xxxxhd| 精品国产91久久久久久浪潮蜜月| 欧美在线3区| 日韩dvd碟片| 国产91av视频在线观看| 你懂的国产精品永久在线| 台湾无码一区二区| 亚洲精品女人| 超碰97人人射妻| 日本视频一区二区| 午夜一区二区视频| 成人免费看的视频| 国产精品九九九九九| 国产女人18毛片水真多成人如厕 | 亚洲人成亚洲精品| 婷婷久久青草热一区二区| 91亚洲一区| 波多野结衣av一区二区全免费观看| 亚洲激情黄色| 免费裸体美女网站| 蜜桃一区二区三区在线观看| 午夜激情视频网| 成人v精品蜜桃久久一区| 一卡二卡三卡四卡| 亚洲视频网在线直播| 日本少妇激情视频| 欧美在线你懂得| aaa一区二区| 精品中文字幕久久久久久| 92国产在线视频| 欧美激情欧美狂野欧美精品| 偷拍视频一区二区三区| 91久久精品在线| 嫩草国产精品入口| 一区二区免费在线观看| 亚洲私拍自拍| 高清av免费看| 成人av手机在线观看| 东京热无码av男人的天堂| 亚洲一区二区三区四区在线免费观看| 国产成人免费看| 欧美一区永久视频免费观看| 色猫av在线| 欧美久久久精品| 色豆豆成人网| 国产精品免费看一区二区三区| 经典一区二区| 亚洲精品久久久久久久蜜桃臀| 日韩av不卡在线观看| 欧美做受高潮中文字幕| 国产欧美精品一区二区色综合 | 欧美丰满嫩嫩电影| 亚洲aaaaaaa| 久久97精品久久久久久久不卡| 欧美影视资讯| 国产三区精品| 欧美激情日韩| www.色欧美| 久久精品亚洲精品国产欧美kt∨| 免费在线观看日韩| 欧美三区在线视频| 四虎在线免费看| 久久99热精品| va天堂va亚洲va影视| 五月天亚洲综合小说网| 99日韩精品| 亚洲视频天天射| 亚洲品质自拍视频网站| 中日韩av在线| 亚洲精品视频播放| av电影在线地址| 亚洲一区二区三区成人在线视频精品| 不卡一区2区| 成人免费在线小视频| 国产91丝袜在线播放0| 国产精品视频一区二区三| 在线国产电影不卡| 青青青免费视频在线2| 91精品国产网站| 免费成人蒂法| 97干在线视频| 成人免费毛片aaaaa**| 免费网站观看www在线观| 欧美一级视频精品观看| av在线影院| 91精品国产99久久久久久红楼| 香蕉av一区二区| 国产福利精品一区二区三区| 国产精品久久久久久久久免费丝袜 | 天天综合网91| 国内国产精品天干天干| 国产精品二三区| 伊人久久成人网| 夜夜嗨av一区二区三区免费区| 第四色男人最爱上成人网| 美日韩免费视频| 亚洲欧美日本日韩| 魔女鞋交玉足榨精调教| 欧美性xxxx| 国产一级二级三级在线观看| 国产脚交av在线一区二区| 九九精品在线| 日韩精品一区二区三区不卡| 国产午夜精品久久久久久免费视 | 国产日韩一区欧美| 国产视频久久| 国产sm调教视频| 欧美日韩国产一级二级| 成人video亚洲精品| 国产传媒一区二区三区| 亚洲专区一区| 国产毛片欧美毛片久久久| 欧美日韩综合在线免费观看| 免费黄网在线观看| 成人免费视频观看视频| 亚洲精品人人| 国产123在线| 日韩一区二区在线看| 超碰资源在线| 欧美在线视频二区| 国内精品不卡在线| 国产精品第一页在线观看| 亚洲欧美国产精品久久久久久久 | 亚洲欧美小说色综合小说一区| 日本成人三级| 国产在线精品视频| 国产精品不卡av| 在线日韩欧美视频| 亚洲亚洲一区二区三区| 国产又黄又猛视频| 亚洲四区在线观看| 无码国产精品一区二区免费16| 国产精品欧美激情| 精品二区视频| 一级片久久久久| 欧美刺激脚交jootjob| 日韩电影av| 亚洲一区 在线播放| 久久亚洲私人国产精品va媚药| 97国产成人无码精品久久久| 久久久久国产精品免费网站| 精品国产欧美日韩| 精品国产一二区| 欧美午夜免费电影| 国产精品蜜芽在线观看| 一区二区精品国产| ww久久中文字幕|