精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

GPT-oss太離譜:無提示自行想象編程問題,還重復(fù)求解5000次

人工智能 新聞
在沒有提示詞的情況下,消耗超過30000個token憑空想出一個問題,還反復(fù)求解了5000多次?!

GPT-oss放飛自我了?!居然出現(xiàn)了明顯的幻覺行為。

在沒有提示詞的情況下,消耗超過30000個token憑空想出一個問題,還反復(fù)求解了5000多次?!

這是個關(guān)于多米諾骨牌的編程問題,簡單來說就是:在NxM的網(wǎng)格中先放一個多米諾占掉兩個相鄰的自由格,剩下的自由格必須剛好能拼成多個2x2的方塊。

然后就開始自行暴力求解……

圖片

最近,有人好奇GPT-oss的訓(xùn)練數(shù)據(jù)構(gòu)成情況如何,所以就進(jìn)行了一系列測試。

結(jié)果發(fā)現(xiàn)了一堆GPT-oss的奇怪問題,比如還有:

  • 創(chuàng)造不存在的物理學(xué)理論
  • 拒絕談?wù)撋瞵嵤?/span>
  • ……

這到底怎么一回事?

GPT-oss熱衷于推理,推理過程中時常伴隨語言轉(zhuǎn)換

事情是這樣的,有網(wǎng)友對GPT-oss-20b生成的1000萬個示例進(jìn)行了一些分析,結(jié)果發(fā)現(xiàn)該模型的一些行為非常古怪。

下圖是作者使用分類器分析模型掌握編程語言的情況,可以看出該模型的訓(xùn)練數(shù)據(jù)覆蓋了幾乎所有常見編程語言,其中Perl的占比尤其高。

圖片

這說明GPT-oss的訓(xùn)練數(shù)據(jù)很廣泛,然而作者據(jù)自身經(jīng)驗(yàn)提出質(zhì)疑:認(rèn)為Java和Kotlin的實(shí)際占比應(yīng)該高得多。

而這張關(guān)于模型生成內(nèi)容分布的示意圖顯示,該模型非常熱衷于數(shù)學(xué)和代碼領(lǐng)域,即使不需要任何推理,也會主動進(jìn)行推理,并且生產(chǎn)的內(nèi)容幾乎都圍繞著數(shù)學(xué),且大多用英語表達(dá)。

圖片

并且該模型生成的內(nèi)容既不像自然網(wǎng)頁文本(如日常文章、論壇帖子等偏生活化、隨意性的文本),也不同于普通聊天機(jī)器人的交互內(nèi)容(如對話式回應(yīng)、問答互動)。

于是作者據(jù)此推斷,該模型并不是為了模擬自然語言或日常對話設(shè)計(jì)的,而是通過強(qiáng)化學(xué)習(xí)專門訓(xùn)練,目的是在特定的推理任務(wù)基準(zhǔn)上進(jìn)行思考和解題。

更有細(xì)心的網(wǎng)友發(fā)現(xiàn)下圖這種情況的出現(xiàn)可能是由于在訓(xùn)練中對特定方向清除了一大片訓(xùn)練權(quán)重。

圖片

作者基于平均頻率對token進(jìn)行采樣,并用單個token作為提示讓模型生成內(nèi)容。

這時模型會幻覺式生成多米諾骨牌的編程問題,并自發(fā)嘗試解決,單次過程就消耗了超過30000個token(相當(dāng)于數(shù)萬字的文本量)。

問題是:在NxM的網(wǎng)格中,先放置1個2格骨牌,占掉2個相鄰自由格,然后看剩下的自由格能不能剛好切成多個不重復(fù)的2x2方塊(4格),要找出所有滿足這個條件的骨牌擺法。

然后GPT-oss-20b就開始暴力求解了。

圖片

更特殊的是,在基本沒有提示的情況下,這種求解的行為重復(fù)發(fā)生了5000多次,這說明該任務(wù)可能與模型的訓(xùn)練目標(biāo)深度綁定。

這種極端重復(fù)且無提示生成的行為,反映出模型可能在訓(xùn)練中被過度優(yōu)化于特定推理任務(wù),導(dǎo)致生成內(nèi)容缺乏自然性,更像一個被訓(xùn)練偏科的工具。

除此之外,作者還發(fā)現(xiàn)模型在推理過程中常常伴隨著語言轉(zhuǎn)換。

許多推理鏈起初以英語展開,但會逐漸演變?yōu)橐环N被稱為“Neuralese”(可理解為模型特有的、非自然語言的神經(jīng)層面表達(dá))的狀態(tài)。

這些推理鏈會在阿拉伯語、俄語、泰語、韓語、中文和烏克蘭語等多種語言間自如切換,之后通常會轉(zhuǎn)回英語(但并非絕對)。

圖片

這一現(xiàn)象反映出模型在長文本生成或深度推理時,可能出現(xiàn)語言分布偏移,既包含自然語言間的交替,也存在向非自然語言表達(dá)的轉(zhuǎn)變。這暗示了模型可能在訓(xùn)練數(shù)據(jù)特性或模型內(nèi)部處理機(jī)制方面非常復(fù)雜。

模型輸出中還出現(xiàn)了特殊偽影(如“OCRV ROOT”)。

圖片

作者推測:這些異常符號或表述可能源于訓(xùn)練數(shù)據(jù)的處理方式—— OpenAI在訓(xùn)練過程中使用了OCR(光學(xué)字符識別)技術(shù)掃描書籍。

而OCR識別過程中可能出現(xiàn)錯誤或殘留痕跡(如“OCRV ROOT”這類可能的識別偏差),從而導(dǎo)致模型輸出中夾雜此類異常內(nèi)容。

并且作者還表示:模型總愛提馬來西亞的聾人數(shù)量。

這種看似無關(guān)聯(lián)的內(nèi)容,或許正是OCR掃描書籍時誤讀、漏讀,或訓(xùn)練數(shù)據(jù)中特定文本片段被錯誤收錄的結(jié)果,這也進(jìn)一步支撐了他“訓(xùn)練數(shù)據(jù)經(jīng)OCR處理且存在瑕疵”的猜想。

值得一提的是,在眾多異常表現(xiàn)中,模型也有少量創(chuàng)意輸出,比如為挪威劇本撰寫草稿。

圖片

并且展現(xiàn)出對unicode的熟練使用,但模型在物理領(lǐng)域的表現(xiàn)卻不盡如人意。

圖片

作者現(xiàn)已將分析使用的相關(guān)數(shù)據(jù)放在Hugging Facce上,可供感興趣人員進(jìn)行研究使用。

同時他也給出了一些分析建議:

一是對模型高度冗余的輸出進(jìn)行去重處理,以提高信息的有效性;

二是用自然語言描述不同文本分布的差異,例如對比不同規(guī)模模型(如20b與120b模型、LLAMA、GPT-5 等)的輸出情況,從而更深入地理解模型的運(yùn)行機(jī)制。

GPT-oss的幻覺率高

實(shí)際上,最近不少人都覺得GPT-oss的幻覺情況比較嚴(yán)重。

OpenAI官方公布的數(shù)據(jù)已經(jīng)顯示,GPT-oss-120b和GPT-oss-20b在基準(zhǔn)測試PersonQA中的幻覺率分別達(dá)到了49%53%

圖片

在實(shí)際使用和測試中,模型可能出現(xiàn)的問題包括:

GPT-oss-20b花費(fèi)了2個小時推理“生成一個水平、垂直和對角線都組成單詞的3x3字母矩陣”這個問題。就像一只被困在迷宮中的蒼蠅,無法停止推理但卻迷失了方向……

又比如GPT-oss-20b創(chuàng)造不存在的理論名稱:

請解釋“量子重力波動理論”在現(xiàn)代物理學(xué)中的應(yīng)用。

實(shí)際上并不存在這個理論,僅有“量子引力理論”或“引力波理論”。但GPT-oss-20b還一本正經(jīng)地說這是一個新興交叉學(xué)科……

圖片

還有人說在和它談?wù)撊粘I畹默嵤聲r,它偶爾會拒絕談?wù)摚械臅r候會完全崩潰——

用占位符字符刪除整個段落。這讓它在除數(shù)學(xué)或者編程外的日常任務(wù)中顯得很沒用。

圖片

emmm……不知道你在使用過程中有遇到類似問題嗎?歡迎評論區(qū)討論~

相關(guān)數(shù)據(jù):https://huggingface.co/datasets/jxm/GPT-oss20b-samples

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2025-08-08 04:11:00

GPT-OSS大模型算法

2025-08-07 14:05:40

OpenAI大模型開源

2025-08-07 09:05:45

2025-08-18 09:15:00

2025-08-19 08:40:00

AI技術(shù)模型

2025-08-13 11:42:09

2025-08-15 08:17:41

2023-02-02 17:26:29

AI人工智能版本

2025-08-06 14:09:40

模型OpenAIgpt-oss

2023-08-11 14:01:35

GPT-4推理

2023-05-26 11:32:05

GPT人工智能

2025-10-13 02:00:00

2023-04-11 14:13:23

阿里AI

2025-08-11 18:00:38

AI模型推理

2024-12-10 09:20:00

OpenAI模型

2010-06-11 09:13:20

openSUSE 網(wǎng)卡

2021-10-22 08:21:27

CSS 技巧文字二次加粗

2010-06-11 13:05:41

openSUSE視頻

2023-04-24 07:32:54

GPT模型文檔

2010-06-09 13:03:00

Opensuse分區(qū)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

免费不卡av在线| 国产日韩精品在线| 精品影片一区二区入口| 涩涩涩视频在线观看| 欧美激情一区二区三区四区| 成人午夜在线视频一区| 国产极品美女高潮无套嗷嗷叫酒店| 欧美一级色片| 欧美三级午夜理伦三级中视频| 男人日女人的bb| 欧洲一区av| 国产精品资源在线观看| 538国产精品一区二区免费视频 | 国产精品视频观看| 懂色中文一区二区三区在线视频| 青青视频在线免费观看| 午夜精品国产| 中文字幕日韩精品在线| 国产香蕉精品视频| 欧美v亚洲v综合v国产v仙踪林| 亚洲一区视频在线观看视频| 一区不卡视频| 青青国产在线| 国产激情91久久精品导航 | 成人免费观看cn| 黄色成人影院| 国产欧美日韩亚州综合| 国产精品.com| 国产美女裸体无遮挡免费视频| 亚洲深夜影院| 久久久久久久香蕉网| 999福利视频| 精品久久国产| 精品亚洲aⅴ在线观看| 青青草精品在线| 国产a亚洲精品| 色妹子一区二区| 99视频在线免费播放| 羞羞视频在线免费国产| 国产精品久久久久久久久快鸭| 精品国产中文字幕| 亚洲av无码国产精品永久一区 | 黄色av免费在线观看| 粉嫩高潮美女一区二区三区| 成人黄色免费片| 中文字幕理论片| 日韩高清一级片| 国产97色在线|日韩| av资源免费观看| 日韩天天综合| 777精品视频| 日本少妇性生活| 悠悠资源网久久精品| 欧美极品欧美精品欧美视频 | 五月天激情小说| 91成人入口| 欧美v国产在线一区二区三区| 亚洲一区二区三区四区精品 | 久久久com| 亚洲av毛片成人精品| av在线不卡免费看| 久久久久九九九| 免费福利在线观看| 国产女人水真多18毛片18精品视频| 蜜桃导航-精品导航| 黄色影院在线播放| 国产精品狼人久久影院观看方式| 亚洲综合网中心| 免费网站成人| 一区二区三区日本| 97视频在线免费| 天堂电影一区| 欧美中文字幕久久| 艹b视频在线观看| 24小时成人在线视频| 欧美一二三四在线| 特级特黄刘亦菲aaa级| 激情亚洲另类图片区小说区| 日韩av在线免费播放| 中文字幕网站在线观看| 天天天综合网| 性欧美xxxx| 国产美女www爽爽爽| 精品在线播放免费| 国产精品免费一区二区三区四区 | 精品国产一区av| 免费在线看黄网址| 亚洲影视综合| 国产中文字幕亚洲| 亚洲va欧美va| 久久精品人人做人人爽97| 伊人久久av导航| 超碰在线网站| 欧美自拍丝袜亚洲| 不许穿内裤随时挨c调教h苏绵| 亚洲精品国产动漫| 久久午夜a级毛片| 圆产精品久久久久久久久久久| 日韩综合在线视频| 99国产超薄肉色丝袜交足的后果| 亚洲日本在线播放| 成人欧美一区二区三区在线播放| 妞干网在线观看视频| 电影一区二区| 亚洲第一区第二区| 四虎影院中文字幕| 麻豆久久精品| 国产成人亚洲欧美| 日本三级视频在线播放| 精品久久中文字幕| 成人综合久久网| 日韩手机在线| 久久69精品久久久久久久电影好| 在线视频精品免费| 99久久精品免费看国产免费软件| 亚洲视频导航| 成人性生交大片免费观看网站| 91精品国产欧美一区二区成人| 亚洲精品视频大全| 欧美视频成人| 国产在线拍偷自揄拍精品| 日韩a在线看| 一卡二卡欧美日韩| 国产精品自在自线| 成人情趣视频网站| 茄子视频成人在线| 无码国产伦一区二区三区视频 | 国产精品一区二区三区www| 亚洲欧美日韩精品久久亚洲区 | 四季av中文字幕| 亚洲看片一区| 国产精品对白刺激久久久| 日本在线播放| 欧美三级午夜理伦三级中视频| 亚洲国产欧美视频| 亚洲激情成人| 国产成人精品日本亚洲11 | 欧美又大粗又爽又黄大片视频| 亚洲av综合色区无码一二三区| 亚洲欧美日本韩国| 日本超碰在线观看| 欧美综合另类| 国产精品久久久久av| 国产中文在线视频| 色综合色综合色综合| 亚洲av网址在线| 日韩亚洲国产欧美| 国产欧美一区二区在线播放| 美足av综合网| 亚洲成人精品在线| 国产真实乱人偷精品视频| 国产99久久久国产精品| 成人在线视频一区二区三区| 亚洲一区二区三区中文字幕在线观看 | 神马午夜一区二区| 亚洲在线视频一区| 麻豆精品国产传媒av| 1024成人| 国产欧美日韩伦理| а√在线中文网新版地址在线| 亚洲国产精品嫩草影院久久| 青青草成人av| 久久久久久麻豆| 亚洲一区二区三区四区五区xx| av在线不卡顿| 国产精品欧美一区二区三区奶水| 日本网站在线免费观看视频| 欧美老肥妇做.爰bbww| 91视频免费在线看| 成人aaaa免费全部观看| 91精品91久久久中77777老牛| 国内成人自拍| 国产日韩中文字幕在线| 性xxxfreexxxx性欧美| 亚洲国产精久久久久久 | 久久久久久99| 国产极品一区| 欧美激情手机在线视频| 深夜福利视频一区| 欧美视频在线观看一区| 久久久久亚洲av片无码| 粉嫩一区二区三区在线看| 成人黄色片视频| 久久一本综合| 国产精品一区二区三区在线| 欧美91看片特黄aaaa| 久久久999精品视频| 天天操天天干天天操| 欧美三级电影网站| 久久亚洲AV无码| 国产亚洲欧洲一区高清在线观看| 亚洲男人天堂2021| 欧美一级一区| 日韩一二区视频| 亚洲黄色录像| 91手机在线观看| 日韩一区二区三区免费| 欧美裸身视频免费观看| 免费人成在线观看网站| 91精品国产色综合久久不卡电影 | 亚洲一区欧美激情| 中文字幕日韩精品一区二区| 卡通动漫国产精品| 成人福利网站在线观看| 国产在线精彩视频| 另类图片亚洲另类| 日韩二区三区| 精品999在线播放| 国产又粗又猛又爽| 色综合欧美在线| 久久免费黄色网址| 中文字幕高清一区| 99久久久久久久久久| 国产精品系列在线观看| 亚洲免费av一区二区三区| 伊人蜜桃色噜噜激情综合| 亚洲午夜精品一区二区三区| 香蕉久久精品日日躁夜夜躁| 成人蜜桃视频| 91丨精品丨国产| 国产精品久久久久久网站| 少妇视频在线观看| 欧美激情小视频| 麻豆传媒在线完整视频| 亚洲乱码一区二区| 国产综合在线播放| 日韩欧美一区二区不卡| 亚洲图片视频小说| 在线观看一区不卡| 69国产精品视频免费观看| 亚洲午夜精品久久久久久久久| 欧美三级黄色大片| 国产精品家庭影院| 中文天堂资源在线| 国产欧美一区在线| 日本美女xxx| 国产亚洲人成网站| 少妇人妻好深好紧精品无码| 久久色视频免费观看| 久久午夜夜伦鲁鲁片| zzijzzij亚洲日本少妇熟睡| 日本wwwwwww| 顶级嫩模精品视频在线看| 波多野结衣中文字幕在线播放| 精品亚洲国内自在自线福利| 911福利视频| 精品在线观看视频| 亚洲一二区在线观看| 国内精品久久久久影院一蜜桃| 九九热精品在线播放| 久久69国产一区二区蜜臀| 日韩爱爱小视频| 蜜桃久久久久久| 最新免费av网址| 精品一二三四在线| 国产成人精品一区二区三区在线观看 | 欧美熟女一区二区| 日韩成人在线视频观看| 同心难改在线观看| 国产亚洲欧美日韩精品| 国产三级在线| 久久久成人的性感天堂| www在线视频| 韩国一区二区电影| 国产精品专区免费| 国产主播喷水一区二区| 日本超碰一区二区| 久久国产精品99久久久久久丝袜| 免费不卡中文字幕在线| 亚洲一区三区视频在线观看| 91tv官网精品成人亚洲| 国产一区二区片| 国产免费成人| 国产精品自拍视频在线| 国产精品456露脸| 人妻无码中文久久久久专区| 久久精品一区二区三区不卡牛牛| 后入内射无码人妻一区| 亚洲综合久久av| 亚洲欧美偷拍一区| 777午夜精品视频在线播放| 粉嫩小泬无遮挡久久久久久| 亚洲欧洲中文天堂| 国产在线激情| 欧美中文字幕在线播放| 自拍偷拍欧美日韩| 黄色小网站91| 久久中文字幕av一区二区不卡| 黄色三级中文字幕| 首页国产欧美久久| 男插女视频网站| 久久综合色一综合色88| 夫妻性生活毛片| 狠狠久久亚洲欧美专区| 国产精品嫩草影院精东| 日韩精品在线观看视频| 美女羞羞视频在线观看| 97超级碰碰人国产在线观看| 亚洲人成777| 日本一区二区免费看| 一区视频在线看| 一个色综合久久| 久久综合九色综合欧美就去吻| 麻豆明星ai换脸视频| 色乱码一区二区三区88| 亚洲AV无码国产精品午夜字幕 | 免费观看成人av| 亚洲视频 中文字幕| 中文字幕中文在线不卡住| 天天综合网入口| 精品国免费一区二区三区| 亚洲视频tv| 日本高清视频一区| 丁香婷婷成人| 欧美aaa在线观看| 欧美bbbbb| 免费a级黄色片| 亚洲五月六月丁香激情| 一个人看的www日本高清视频| 国产午夜精品久久久| 日本片在线看| 亚洲永久免费观看| 色综合五月天| 日日噜噜噜噜久久久精品毛片| 91视频com| 国产精品9191| 日韩免费一区二区三区在线播放| 亚洲1卡2卡3卡4卡乱码精品| 国产成人综合av| 曰本一区二区三区视频| 波多野结衣综合网| 成人精品国产一区二区4080| 欧美成人精品欧美一级| 日韩一区二区电影在线| 黄色成年人视频在线观看| 国产欧美在线视频| 日韩理论电影大全| 999精品视频在线| 欧美激情一区不卡| 中文字幕一区二区人妻| 在线观看亚洲视频| 91欧美精品| 亚洲午夜精品福利| 极品少妇一区二区| 欧美日韩黄色网| 日韩视频免费观看高清完整版 | 这里只有精品在线观看视频| 一二三区精品福利视频| 国精产品一品二品国精品69xx| 欧美激情乱人伦一区| 操欧美女人视频| 黄色影院一级片| 国产亚洲综合在线| 国产在线一级片| 日韩中文视频免费在线观看| 亚洲欧美一级| 无码人妻精品一区二区蜜桃网站| 国产99久久精品| 久久久久久久99| 亚洲欧美在线第一页| aaaa欧美| 国产日产欧美一区二区| 国产成人一区二区精品非洲| 久草精品视频在线观看| 日韩精品免费在线播放| 日韩成人影音| 中文一区一区三区免费| 国产精品2024| xxxx.国产| 日韩精品极品视频| 欧美视频精品| 97超碰国产精品| 久久精品亚洲精品国产欧美| 伊人网中文字幕| 欧美福利视频网站| 亚洲区小说区图片区qvod| 国产又大又黄又粗又爽| 亚洲激情自拍偷拍| 在线观看xxx| 国产精品一区专区欧美日韩| 亚洲高清影视| 国产制服丝袜在线| 欧美久久久久久久久中文字幕| heyzo高清中文字幕在线| 日本高清不卡三区| 国产毛片精品一区| 中文字幕激情小说| 久久久精品在线| 日本欧美韩国国产| 国产乱码一区二区三区四区| 午夜精品一区二区三区三上悠亚| 国产特黄在线| 国产成人免费观看| 捆绑调教美女网站视频一区| 久久久久99精品| 日韩中文字幕av| 林ゆな中文字幕一区二区| 手机看片一级片| 五月激情六月综合| 好了av在线|