精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

文字順序不影響GPT-4閱讀理解,別的大模型都不行

人工智能 新聞
原來是一個叫做Jon Rahm的人贏得了2023年美國大師賽(高爾夫)的故事。 并且,如果你直接就這段亂碼對GPT-4進行提問,它也能先理解再給出正確答案,一點兒也不影響閱讀。

研表究明,漢字序順并不定一影閱響讀(對于英文來說,則是每一個單詞中的字母順序)

現在,日本東京大學的一項實驗發現,這個“定理”居然也適合GPT-4。

比如面對這樣一段“鬼畫符”,幾乎里面每一個單詞的每一個字母都被打亂

oJn amRh wno het 2023 Meatsrs ermtnoTuna no duySan taatgsuAu ntaaNloi Gflo bClu, gnelcinhi ish ifsrt nereg ecatkjnad ncedos raecer jroam。

但GPT-4居然完美地恢復出了原始句子(紅框部分)

圖片

原來是一個叫做Jon Rahm的人贏得了2023年美國大師賽(高爾夫)的故事。 

并且,如果你直接就這段亂碼對GPT-4進行提問,它也能先理解再給出正確答案,一點兒也不影響閱讀:

圖片

對此,研究人員感到非常吃驚

按理說亂碼單詞會對模型的tokenization處理造成嚴重干擾,GPT-4居然和人類一樣不受影響,這有點違反直覺啊。

值得一提的是,這項實驗也測試了其他大模型,但它們全都挑戰失敗——有且僅有GPT-4成功。

具體怎么說?

文字順序不影響GPT-4閱讀

為了測試大模型抗文字錯亂干擾的能力,作者構建了一個專門的測試基準:Scrambled Bench。

它共包含兩類任務

一是加擾句子恢復(ScrRec),即測試大模型恢復亂序句子的能力。

它的量化指標包括一個叫做恢復率(RR)的東西,可以簡單理解為大模型恢復單詞的比例。

二是加擾問答(ScrQA),測量大模型在上下文材料中的單詞被打亂時正確理解并回答問題的能力。

由于每個模型本身的能力并不相同,我們不好直接用準確性來評估這一項任務,因此作者在此采用了一個叫做相對性能增益(RPG)的量化指標。

具體測試素材則選自三個數據庫

一個是RealtimeQA,它每周公布當前LLM不太可能知道的最新消息;

第二個是DREAM(Sun et al.,2019),一個基于對話的多項選擇閱讀綜合數據集;

最后是AQuARAT,一個需要多步推理才能解決的數學問題數據集。

對于每個數據集,作者從中挑出題目,并進行不同程度和類型的干擾,包括:
1、隨機加擾(RS),即對每一個句子,隨機選擇一定比例(20%、50%、100%)的單詞,對這些單詞中的所有字母進行打亂(數字不變)

2、保持每個單詞的第一個字母不變,剩下的隨意排列(KF)

3、保持每個單詞的首字母和最后一個字母不變,剩下的隨機打亂(KFL)

參與測試的模型有很多,文章正文主要報告了以下幾個:

text-davinci-003、GPT-3.5-turbo、GPT-4、Falcon-180b和Llama-2-70b。

首先來看不同干擾類型的影響。

如下圖所示:

在KFL設置中(即首尾字母不變),不管是加擾句子恢復還是加擾問答任務,模型之間的性能差距都不大。

然而,隨著干擾難度越來越高(變為KF和RS后),模型的性能都迎來顯著下降——除了GPT-4。

具體而言,在加擾句子恢復(ScrRec)任務中,GPT-4的恢復率始終高于95%,在加擾問答(ScrQA)任務中,GPT-4的相對準確性也都始終維在85%-90%左右。

相比之下,其他模型有的都掉到了不足20%。

圖片

其次是不同加擾率的影響。

如下圖所示,可以看到,在加擾句子恢復(ScrRec)任務中,隨著一個句子中被干擾的單詞數量越來越多,直至100%之后,只有GPT-3.5-turbo和GPT-4的性能沒有顯著變化,當然,GPT-4還是比GPT-3.5優先了很大一截。

圖片

而在加擾問答(ScrQA)任務中,隨著句子中被打亂的單詞數量越來越多,所有模型性能都出現了都顯著下降,且差距越來越大。

但在其中,GPT-4還能以87.8%的成績保持遙遙領先,并且下降幅度也是最輕微的。

所以簡單總結來說就是:

大多數模型都可以處理一定比例的干擾文本,但到極端程度時(比如單詞全部打亂),就只有GPT-4表現最好,只有GPT-4面對完全混亂的詞序,幾乎不怎么被影響。

GPT-4還擅長分詞

在文章最后,作者指出:

除了打亂單詞字母順序之外,還可以研究插入字母、替換字母等情況的影響。

唯一的問題是,由于GPT-4為閉源,大家也不好調查為什么GPT-4可以不被詞序影響。

有網友發現,除了本文所證明的情況,GPT-4也非常擅長將下面這一段完全連起來的英文:

UNDERNEATHTHEGAZEOFORIONSBELTWHERETHESEAOFTRA
NQUILITYMEETSTHEEDGEOFTWILIGHTLIESAHIDDENTROV
EOFWISDOMFORGOTTENBYMANYCOVETEDBYTHOSEINTHEKN
OWITHOLDSTHEKEYSTOUNTOLDPOWER

正確分隔開來:

Underneath the gaze of Orion’s belt, where the Sea of Tranquility meets the edge of twilight, lies a hidden trove of wisdom, forgotten by many, coveted by those in the know. It holds the keys to untold power.

按理來說,這種分詞操作是一件很麻煩的事兒,通常需要動態編程等操作。

GPT-4表現出來的能力再次讓這位網友感到驚訝。

他還把這段內容放進了OpenA官方的tokenizer工具,發現GPT-4看到的token其實是這樣的:

UNDER NE AT HT HE GA Z EOF OR ION SB EL TW HER ET HE SEA OF TRA

這里面除了“UNDER”、“SEA”和“OF”之外,幾乎剩下的所有token都看起來“毫無邏輯”,這更加使人費解了。

圖片

對此,大伙是怎么看的呢?

責任編輯:張燕妮 來源: 量子位
相關推薦

2023-06-21 13:37:41

模型研究

2023-07-04 14:01:26

GPT-4模型

2023-06-19 08:19:50

2023-12-26 08:17:23

微軟GPT-4

2023-06-05 12:32:48

模型論文

2025-04-16 09:35:03

2023-05-29 09:29:52

GPT-4語言模型

2023-04-09 16:17:05

ChatGPT人工智能

2025-05-30 07:40:56

2024-04-25 16:56:14

GPT-4大模型人工智能

2023-07-05 09:57:11

2023-09-19 13:48:31

AI數據

2023-09-11 15:57:16

人工智能模型GPT-4

2023-08-11 13:15:35

ChatGPTMBTIGPT-4

2023-06-08 08:09:43

2023-11-15 09:23:00

模型AI

2024-05-13 07:14:03

GPT-4生成式AIAI模型

2024-01-30 21:18:57

模型智能CMMLU

2024-01-16 12:31:13

OpenAIGLM-4大模型

2023-09-03 12:56:43

點贊
收藏

51CTO技術棧公眾號

欧美精品一区二区成人| 亚洲免费成人在线视频| 国产女主播在线写真| 热久久免费视频| 麻豆国产精品va在线观看不卡| 亚洲一区二区三区精品视频| 中文字幕欧美在线观看| 欧美91福利在线观看| 亚洲精品国产精品乱码不99按摩 | 中文字幕在线不卡一区二区三区| 午夜精品蜜臀一区二区三区免费| 亚洲一二三不卡| 成人在线高清免费| 国产日产欧美一区| 国产一级精品aaaaa看| 中文字幕在线网址| 国产一区二区三区的电影| 中文国产亚洲喷潮| 国产伦精品一区二区三区精品| 日本高清成人vr专区| 91首页免费视频| 91亚洲国产成人久久精品网站| 免费黄色在线网址| 麻豆国产欧美一区二区三区r| 亚洲永久精品大片| 色综合电影网| 三级网站免费观看| 国产一区不卡精品| 国产精品欧美日韩久久| 可以免费看的av毛片| 欧美深夜福利| 久久黄色av网站| 俄罗斯毛片基地| 亚洲大片精品免费| 欧美精品一区二| 日日夜夜精品视频免费观看 | 最新国产精品久久精品| 精品欧美一区二区在线观看视频 | 最新av在线播放| 国产精品午夜在线观看| 久久精品第九区免费观看| 亚洲精品综合久久| 国产精品自产自拍| 成人精品在线观看| 一区二区视频网站| 日韩电影在线观看电影| 国产69久久精品成人看| 日韩少妇高潮抽搐| 亚洲精品激情| 97人人模人人爽人人喊中文字| 国产呦小j女精品视频| 国产精品videossex| 日韩欧美国产三级| 日韩精品国产一区| 91成人噜噜噜在线播放| 日韩欧美在线一区二区三区| 国产精品久久久久久久99| 香蕉久久久久久| 欧美精选午夜久久久乱码6080| 久久99久久久久久| 久久久久黄久久免费漫画| 亚洲国产视频在线| 五月丁香综合缴情六月小说| av在线加勒比| 欧美色播在线播放| 国产成人手机视频| 日韩一区二区三区免费| 欧美午夜一区二区| 狠狠干狠狠操视频| 日韩欧美中文字幕在线视频 | 在线播放av中文字幕| 91精品亚洲一区在线观看| 欧美精品免费视频| 日韩欧美理论片| 亚州一区二区| 日韩成人久久久| 黄色a一级视频| 成人免费看片39| 久久综合久中文字幕青草| 欧美成人精品一区二区免费看片| 国产午夜一区| 日韩一中文字幕| 日韩a级片在线观看| 亚洲高清久久| 国产成人啪精品视频免费网| 一区二区国产欧美| 成人美女视频在线看| 麻豆传媒一区| 欧美三级黄网| 天涯成人国产亚洲精品一区av| 丰满女人性猛交| jizz一区二区三区| 日本道在线观看一区二区| 国产欧美一区二| 欧美高清视频看片在线观看| 国产一区二区三区在线| 波多野结衣亚洲色图| 国产一区91| 成人有码在线播放| 日本v片在线免费观看| 国产精品国产三级国产a | 欧美国产先锋| 欧美在线视频网| 国产精品无码AV| 99九九99九九九视频精品| 影音先锋欧美资源| 天堂av中文在线观看| 91精品国产一区二区人妖| 日韩av一二区| 欧美日韩一卡| 国产精品亚洲第一区| 亚欧洲精品视频| 亚洲六月丁香色婷婷综合久久 | 久久精品成人| 亚洲一区精品电影| 精品久久av| 亚洲国产精品一区二区www| 亚洲人辣妹窥探嘘嘘| 精品按摩偷拍| 欧美大片在线免费观看| 91丨porny丨在线中文 | 日韩精品一区二区三区色偷偷 | 日韩网址在线观看| 国语精品视频| 中文字幕一精品亚洲无线一区| 国产高清视频免费在线观看| 麻豆久久精品| 精品国产一区二区三区免费| 女囚岛在线观看| 91精品国产综合久久精品性色| 超级砰砰砰97免费观看最新一期| 一区二区三区视频播放| 中文字幕亚洲无线码a| 天堂网视频在线| 99久久99久久综合| 91免费黄视频| 国产精品videossex| 欧美激情xxxx性bbbb| 国产喷水福利在线视频| 国产精品传媒入口麻豆| 邪恶网站在线观看| 精品国产精品国产偷麻豆| 欧美亚洲成人免费| 青青国产在线| 色婷婷国产精品久久包臀| 800av在线播放| 日韩视频久久| 久久精品99久久| 欧美日韩亚洲一区| 欧美精品色一区二区三区| av直播在线观看| 91久久亚洲| 国产精品麻豆免费版| 大香伊人久久| 亚洲精品美女视频| 久久国产视频精品| 久久久久免费观看| 三级在线免费看| 久久精品国产99久久| 国产欧美一区二区三区在线看| 岳乳丰满一区二区三区| 国产欧美日韩在线观看| 美美哒免费高清在线观看视频一区二区 | 亚洲精品在线一区二区| 精品国产视频在线观看| 国产另类ts人妖一区二区| 亚洲欧美日韩另类精品一区二区三区| 午夜毛片在线| 婷婷夜色潮精品综合在线| 一区二区免费在线观看视频| 国产免费成人| 日韩一二三区不卡在线视频| 欧美网站免费| 中文字幕欧美专区| 中文字幕欧美人妻精品一区蜜臀| 成人午夜视频网站| 91成人在线观看喷潮教学| 亚洲宅男一区| 成人精品视频99在线观看免费 | 福利视频一二区| 亚洲免费专区| 国产成人97精品免费看片| www.成人.com| 欧美zozozo| 国产精品久久久久久久久久久久久久久久久 | 免费国产在线视频| 欧美喷水一区二区| 一区二区成人免费视频| 99精品视频在线观看| 亚洲人成无码www久久久| 欧美韩日高清| 久久99国产精品| 欧美久久久网站| 911国产网站尤物在线观看| 91.xxx.高清在线| 日韩欧美中文字幕精品| 日韩久久中文字幕| 亚洲欧美国产毛片在线| 熟妇高潮精品一区二区三区| 麻豆一区二区三区| 国产午夜大地久久| 99久久久久| 久久精品国产一区二区三区不卡| 国产99在线| xxx成人少妇69| 日韩三级电影网| 欧美一区二区观看视频| 精人妻无码一区二区三区| 亚洲欧美日韩小说| 国产精品300页| 麻豆精品新av中文字幕| 大陆av在线播放| 大片网站久久| 黄色国产精品一区二区三区| 精品日韩视频| 国内久久久精品| 成人影院在线看| 伊人久久大香线蕉av一区二区| 免费看污视频的网站| 亚洲精品欧美综合四区| 亚洲一区二区三区日韩| www.欧美.com| 亚洲自拍偷拍视频| 丰满少妇一区| 国产91色在线| 欧美freesex黑人又粗又大| 久久五月天色综合| 日韩精品黄色| 日韩在线视频导航| www黄在线观看| 在线看日韩欧美| 电影av在线| 亚洲午夜国产成人av电影男同| 一区二区www| 欧美在线观看你懂的| 91午夜视频在线观看| 亚洲国产视频a| 久久免费黄色网址| 一区av在线播放| 久久r这里只有精品| 亚洲免费在线观看视频| 久草综合在线视频| 日韩毛片一二三区| 日本一二三区在线观看| 亚洲三级理论片| 成年人一级黄色片| 亚洲欧美一区二区三区国产精品| 亚洲最大免费视频| jizz一区二区| 喷水视频在线观看| 99久久精品免费观看| av2014天堂网| www激情久久| av男人的天堂av| 久久久久久久久久久99999| 中文字幕av观看| 久久夜色精品国产噜噜av | 免费的毛片视频| 日韩欧美在线网址| 久久精品无码av| 在线观看视频一区二区| 综合久久中文字幕| 欧美日韩另类国产亚洲欧美一级| 激情五月色婷婷| 色综合一区二区| 欧美超碰在线观看| 欧美日韩一区二区在线观看| 国产乱码在线观看| 欧美一卡在线观看| 欧美特黄一级视频| 亚洲人a成www在线影院| 中文字幕日本在线观看| 成人444kkkk在线观看| av毛片午夜不卡高**水| 日本中文字幕不卡免费| 国产精品伦一区二区| 97超碰最新| 亚洲人成网亚洲欧洲无码| 午夜精品视频在线观看一区二区| 琪琪久久久久日韩精品| 日韩av在线电影观看| 在线看片不卡| 免费高清在线观看免费| 九九视频精品免费| 久久久久久久人妻无码中文字幕爆| 久久99久久精品| 人妻 日韩 欧美 综合 制服| 国产午夜亚洲精品羞羞网站| 三级黄色录像视频| 亚洲国产精品久久久男人的天堂| 久久精品一区二区三区四区五区 | 欧美日韩国产一二| 成人在线亚洲| www.日本在线播放| 捆绑调教一区二区三区| 亚洲视频 中文字幕| 国产农村妇女毛片精品久久麻豆| 成人免费网站黄| 亚洲品质自拍视频网站| 天堂在线免费观看视频| 欧美久久一二区| 水莓100国产免费av在线播放| 精品av综合导航| 日本在线免费| 日产精品久久久一区二区福利 | 国产精品视频永久免费播放| 日韩国产91| 女女同性女同一区二区三区91| 亚洲丝袜美腿一区| 国内精品国产三级国产99| 首页国产欧美久久| 人妻体内射精一区二区三区| 亚洲欧洲一区二区在线播放| 国产又大又黄又粗| 日韩一卡二卡三卡| 香蕉视频免费在线播放| 日韩av电影手机在线观看| silk一区二区三区精品视频| 亚洲精品免费在线看| 久久狠狠婷婷| 在线观看国产三级| 亚洲午夜精品17c| 国产麻豆91视频| 日韩一区二区三区国产| 成人开心激情| 欧美连裤袜在线视频| 亚洲精选国产| 中文在线观看免费视频| 亚洲国产一区二区三区青草影视| 国产又大又黄视频| 精品剧情在线观看| 亚洲第一图区| 99久久自偷自偷国产精品不卡| 国产精品一线| 老司机午夜免费福利视频| 精品一区二区三区免费毛片爱| 超碰caoprom| 亚洲成人一区二区在线观看| www.看毛片| 欧美激情国内偷拍| 91精品入口| 性一交一乱一伧国产女士spa| 丝袜亚洲精品中文字幕一区| 久久精品国产亚洲av麻豆| 精品久久久久久| 亚洲精品国产片| 欧美激情手机在线视频| 北条麻妃一区二区三区在线观看 | 欧美在线影院| 亚洲女人在线观看| 亚洲日本在线观看| av中文字幕第一页| 久久九九全国免费精品观看| 电影91久久久| 黄色一级片黄色| 9i在线看片成人免费| 影音先锋在线国产| 亚洲午夜激情免费视频| 国产精品久久久久77777丨| 色阁综合av| 国产在线乱码一区二区三区| 黄色一级片在线免费观看| 亚洲高清福利视频| 黑人巨大亚洲一区二区久| 神马影院我不卡午夜| 国内欧美视频一区二区| 国产亚洲精品久久久久久打不开| 欧美日韩免费在线视频| 男人在线资源站| 亚洲综合在线做性| 一区二区日韩免费看| 日本人亚洲人jjzzjjz| 91精品欧美福利在线观看| 国产白丝在线观看| 欧洲在线视频一区| 麻豆久久久久久| 久久精品女人毛片国产| 亚洲视频在线观看免费| 综合久久伊人| 人妻久久久一区二区三区| 国产亚洲视频系列| 国产sm主人调教女m视频| 97精品国产97久久久久久春色| 成人乱码手机视频| jizzjizz国产精品喷水| 亚洲欧洲在线观看av| 天天操天天干天天舔| 国产伦精品一区二区三区精品视频| 国模精品一区| 337p日本欧洲亚洲大胆张筱雨| 亚洲嫩草精品久久| 神马电影在线观看| 成人在线小视频| 国产精品日韩久久久| eeuss中文字幕| 日韩不卡在线观看| 久久国产精品美女| 少妇性l交大片| 亚洲动漫第一页| 老司机福利在线视频|