精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

為什么AI數不清Strawberry里有幾個 r?Karpathy:我用表情包給你解釋一下

人工智能 新聞
讓模型知道自己擅長什么、不擅長什么是一個很重要的問題。

還記得這些天大模型被揪出來的低級錯誤嗎?

不知道 9.11 和 9.9 哪個大,數不清 Strawberry 單詞里面有多少個 r…… 每每被發現一個弱點,大模型都只能接受人們的無情嘲笑。

圖片

嘲笑之后,大家也冷靜了下來,開始思考:低級錯誤背后的本質是什么?

大家普遍認為,是 Token 化(Tokenization)的鍋。

在國內,Tokenization 經常被翻譯成「分詞」。這個翻譯有一定的誤導性,因為 Tokenization 里的 token 指的未必是詞,也可以是標點符號、數字或者某個單詞的一部分。比如,在 OpenAI 提供的一個工具中,我們可以看到,Strawberry 這個單詞就被分為了 Str-aw-berry 三個 token。在這種情況下,你讓 AI 大模型數單詞里有幾個 r,屬實是為難它。

除了草莓 (Strawberry) 之外,還有一個很好的例子就是「Schoolbooks」這個詞,AI 模型會把它分為 school 和 books 兩個 token。

圖片

圖片

這個問題也吸引了剛剛投身 AI + 教育行業的 Karpathy 的注意。為了讓大家直觀地看到大模型眼里的文字世界,他特地寫了一個小程序,用表情符號(emoji)來表示 token。

圖片

按照小程序被設計的表示方法,「How many letters 'r' in the word'strawberry'?」在 LLM 看來是這樣的:

圖片

一段文本在 LLM 看來會是這樣:

圖片

但這種解釋也引起了另一種疑問:如果你讓大模型把 Strawberry 這個詞的每個字母都列出來,然后刪掉 r 以外的字母,大模型就能數對了,那大模型為什么自己不這么做呢?它好像不太會利用自己的能力。

圖片

圖片

對此,Karpathy 給出的回復是「因為沒有人教它這么做」。

圖片

其實,如果你在 Prompt 里加上「think step by step」等思維鏈相關「咒語」,大模型是可以分步驟解決問題的,而且很有可能數對「r」的數量。那它之前不假思索就給出答案,是不是因為過度自信?   

圖片

對此,有人猜測說,大模型公司給 LLM 的設定可能就是讓它在一個問題上花費盡可能少的時間,因此,除非你明確要求,不然它不會主動去深入思考。

圖片

對于這種說法,我們也測試了一下。結果發現,如果明確要求深入思考,模型確實立馬就會數了:   

圖片

這就類似于它有兩套系統:快速、依靠直覺的系統 1 和較慢、較具計劃性且更仰賴邏輯的系統 2,平時默認使用系統 1。

圖片

當然,這些只是猜測。

綜合最近的新聞來看,我們會發現一個有意思的現象:一方面,大模型都能在人類奧數中拿銀牌了;而另一方面,它們又在數數、比大小方面集體翻車。類似的例子還有不會玩幾歲小孩都會玩的井字棋,不會判斷兩個圓是否重疊等。

圖片

Karpathy 給這種現象取了個名字 ——Jagged Intelligence(Jagged 的意思是參差不齊的)。這種參差不齊的智能表現和人類是不一樣的,人類的知識體系和解決問題的能力在成長過程中是高度相關的,并且是同步線性發展的,而不是在某些領域突然大幅度提升,而在其他領域卻停滯不前。

Karpathy 認為,這一問題的核心在于目前的大模型缺乏「認知自我知識(cognitive self-knowledge)」( 模型自身對其知識和能力的自我認知 )。如果模型具備這種能力,它可能會在面對「數字母」這樣的問題時回答說,「我不太擅長數字母,讓我使用代碼解釋器來解決這個問題」。

圖片

這一問題的解決方案可能包括但不限于擴大規模,可能需要在整個技術棧的各個方面都做一些工作,比如在后訓練階段采用更復雜的方法。

對此,Karpathy 推薦閱讀 Llama 3 論文的 4.3.6 章節。在此章節中,Meta 的研究者提出了一些方法來讓模型「只回答它知道的問題」。

圖片

該章節寫到:


我們遵循的原則是,后訓練應使模型「知道它知道什么」,而不是增加知識。我們的主要方法是生成數據,使模型生成與預訓練數據中的事實數據子集保持一致。為此,我們開發了一種知識探測技術,利用 Llama 3 的 in-context 能力。數據生成過程包括以下步驟:


1、從預訓練數據中提取數據片段。

2、通過提示 Llama 3 生成一個關于這些片段(上下文)的事實問題。

3、采樣 Llama 3 關于該問題的回答。

4、以原始上下文為參照,以 Llama 3 為裁判,評估生成的回答的正確性。 

5、以 Llama 3 為裁判,評估生成回答的信息量。

6、對于 Llama 3 模型在多個生成過程中提供的信息雖多但內容不正確的回答,使用 Llama 3 生成拒絕回答的內容。 


我們使用知識探測生成的數據來鼓勵模型只回答它知道的問題,而拒絕回答它不確定的問題。此外,預訓練數據并不總是與事實一致或正確。因此,我們還收集了一組有限的標注事實性數據,這些數據涉及與事實相矛盾或不正確的陳述。


最后,Karpathy 表示,這種參差不齊的智能問題值得注意,尤其是在生產環境中。我們應該致力于讓模型只完成他們擅長的任務,不擅長的任務由人類及時接手。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-07-25 12:11:22

2020-07-06 08:00:26

MySQL程序員SQL

2011-01-18 13:45:58

2024-08-07 10:05:00

LLM大模型技術

2021-08-28 09:06:11

Dubbo架構服務

2025-02-28 09:14:09

JavaNIO機制

2020-02-28 09:09:51

閉包函數作用域

2025-06-25 10:17:48

2021-08-02 07:59:21

單調棧題目

2021-08-02 07:59:47

技術動圖數列

2020-08-13 08:43:24

TCP固定窗口滑動窗口

2021-01-18 05:19:11

數字指紋

2019-08-20 15:01:05

Chrome 瀏覽器 插件

2019-08-16 10:33:00

Chrome插件開發者

2025-03-31 09:20:00

AI模型測試

2023-05-22 10:09:21

FlexboxCSS3

2015-08-04 09:24:50

2021-09-09 08:47:57

TCP三次握手協議

2021-10-25 08:49:32

索引數據庫MySQL
點贊
收藏

51CTO技術棧公眾號

国产成人精品综合在线观看| 999成人精品视频线3| 日韩欧美一区二区在线| 久久伊人一区| 国产又粗又长又黄| 欧美激情在线| 伊人久久男人天堂| 在线观看亚洲免费视频| av成人免费看| 精品福利视频导航| 一级一片免费播放| 日本啊v在线| 另类的小说在线视频另类成人小视频在线| 久久综合久中文字幕青草| 人妻无码中文久久久久专区| 男女啪啪999亚洲精品| 午夜视频一区二区三区| 中文字幕在线观看一区二区三区| 天天操天天射天天舔| 蜜乳av一区二区| 777国产偷窥盗摄精品视频| 欧美自拍偷拍网| 免费看久久久| 91精品福利在线一区二区三区| 欧美日韩亚洲一| 污污的网站在线看| 中文字幕欧美一| 欧美精品成人一区二区在线观看| 99在线精品视频免费观看20| 日本免费新一区视频| 97不卡在线视频| 欧美成人精品欧美一| 成人免费电影网址| 亚洲视频在线观看视频| 欧美成人三级伦在线观看| 精品中文视频| 欧美日韩高清一区二区| 搡女人真爽免费午夜网站| 极品在线视频| 天天影视涩香欲综合网| 69精品丰满人妻无码视频a片| 91社区在线观看播放| 久久亚洲一区二区三区四区| 亚洲综合中文字幕在线观看| 国产精品国产一区二区三区四区| 秋霞成人午夜伦在线观看| 欧美亚洲另类激情另类| 91午夜视频在线观看| 亚洲乱码久久| 欧美国产视频日韩| 国产亚洲精品久久久久久打不开| 欧美福利视频| 欧美国产日本高清在线| 久久久香蕉视频| 国内揄拍国内精品久久| xvideos亚洲人网站| 国产大屁股喷水视频在线观看| 欧美老女人另类| 一区二区欧美久久| 黄色三级生活片| 日韩理论电影大全| 久久九九国产精品怡红院| 免费在线观看a级片| 亚洲午夜精品一区二区国产| 欧美大成色www永久网站婷| 久久久精品国产sm调教| 在线观看的日韩av| 热久久99这里有精品| 免费看日批视频| 日本不卡中文字幕| 91精品国产综合久久久久久蜜臀 | 欧美成人tv| 欧美日本亚洲视频| 精品成人免费视频| 日日夜夜免费精品| 成人激情免费在线| 亚洲精品国产精品国| 99久久精品免费看国产免费软件| 久久久久久亚洲精品不卡4k岛国| 久久电影中文字幕| ...xxx性欧美| 欧美三级在线观看视频| 97久久网站| 日韩视频一区二区三区在线播放| 看全色黄大色黄女片18| 久久av免费| 久久久成人av| 日本最新中文字幕| 蜜臀精品一区二区三区在线观看| 91在线观看免费高清完整版在线观看| 草草视频在线播放| 国产偷国产偷亚洲高清人白洁| 在线观看成人av| 都市激情国产精品| 欧美日本免费一区二区三区| 手机免费看av片| 欧美一级精品片在线看| 欧美日本啪啪无遮挡网站| 天干夜夜爽爽日日日日| 国产精品乡下勾搭老头1| 九色综合婷婷综合| 97超碰在线公开在线看免费| 色综合一区二区三区| 日本wwwxx| 日本a口亚洲| 91黑丝在线观看| 国产精品毛片久久久久久久av| 99国产精品久| 黑人巨茎大战欧美白妇| 欧美激情喷水| 亚洲成人亚洲激情| 麻豆精品一区二区三区视频| 石原莉奈在线亚洲三区| 99久久伊人精品影院| 成年网站在线| 都市激情亚洲色图| 老司机av网站| 91精品国产自产拍在线观看蜜| 浅井舞香一区二区| 神宫寺奈绪一区二区三区| 1024国产精品| 天天操天天爱天天爽| 亚洲人挤奶视频| 高清一区二区三区四区五区| 国产99999| 国产精品麻豆视频| 免费午夜视频在线观看| 另类ts人妖一区二区三区| 久久99热精品| 国产视频手机在线| 中文字幕亚洲一区二区av在线| 日韩 欧美 高清| 欧美xxxx在线| 777精品视频| 天堂av在线资源| 亚洲制服丝袜在线| 久久久久中文字幕亚洲精品| 一区二区日韩欧美| 91在线视频成人| 免费黄色在线看| 欧美乱熟臀69xxxxxx| 中国1级黄色片| 免费看欧美女人艹b| 欧洲亚洲一区二区| 四虎4545www精品视频| 亚洲欧美一区二区精品久久久| 91精品国产乱码久久久张津瑜| 成人av在线播放网址| 久久综合久久久久| 国产一区福利| 91av视频在线| 欧美日本网站| 欧美在线免费观看视频| 国产人妻大战黑人20p| 日韩电影免费在线| 亚洲一区bb| 国产美女亚洲精品7777| 欧美大片在线免费观看| 国产香蕉在线观看| 天天操天天干天天综合网| 亚洲精品理论片| 青青草国产成人av片免费| 亚洲综合首页| 8x国产一区二区三区精品推荐| 欧美激情精品久久久久久变态 | 国产伦精品一区二区三区免费| 黄色一级视频播放| www.久久东京| 日本久久中文字幕| 免费网站成人| 精品国产制服丝袜高跟| 日韩在线视频免费播放| 国产欧美日韩久久| 精品国产午夜福利在线观看| 亚洲三级电影在线观看| 神马影院一区二区| 日韩在线成人| 8x海外华人永久免费日韩内陆视频| 久久国产精品高清一区二区三区| 欧美日韩一区二区三区视频| 婷婷色中文字幕| 久久综合久久综合亚洲| www.天天射.com| 欧美日韩精品一本二本三本| 久热国产精品视频一区二区三区| 国产激情欧美| 欧美精品www| 福利在线播放| 精品蜜桃在线看| 懂色av蜜臀av粉嫩av喷吹| 一区二区三区在线观看国产| 亚洲综合网在线观看| 国产一区二区在线观看视频| 又粗又黑又大的吊av| 亚洲色图国产| 日本午夜精品电影| 国产suv精品一区| 国产精品露脸av在线| sis001亚洲原创区| 色多多国产成人永久免费网站| 欧美性受xxxx狂喷水| 欧美日韩情趣电影| 羞羞影院体验区| 亚洲精品成人精品456| 永久免费av无码网站性色av| 成人美女在线视频| 久久久久久综合网| 香蕉国产精品偷在线观看不卡| 国产一二三四五| 成久久久网站| 欧美一区二区三区电影在线观看| 日韩一区二区三区精品视频第3页| 国产精品91久久久久久| xxx性欧美| 日韩一区二区三区在线播放| 欧美少妇另类| 亚洲国内精品视频| 超碰在线播放97| 欧美精品xxxxbbbb| 亚洲男人天堂网址| 欧美性感美女h网站在线观看免费| 国产乱国产乱老熟300| 国产精品电影一区二区三区| 女女互磨互喷水高潮les呻吟| 成人av电影在线观看| 中文字幕avav| 国产精品影视网| 久久久久久久久久一区二区| 日本91福利区| 日韩在线第三页| 久久精品观看| 国产福利视频在线播放| 亚洲尤物在线| 欧美 国产 日本| 亚洲综合不卡| 国产一区二区三区精彩视频| 亚洲在线一区| 午夜视频在线瓜伦| 日韩精品亚洲专区| 一区二区三区韩国| 免费一级片91| 欧美成人乱码一二三四区免费| 日本在线不卡一区| wwww.国产| 久久er精品视频| 亚洲午夜电影在线| 色yeye香蕉凹凸一区二区av| 亚洲风情第一页| 日韩一级成人av| 精品乱子伦一区二区| 欧美一级欧美三级| 亚洲精品一区二区三区四区| 精品久久久久久无| 日韩一级片免费观看| 亚洲精品久久久一区二区三区| 亚洲aaa在线观看| 精品亚洲aⅴ在线观看| 精品欧美不卡一区二区在线观看 | 欧美性xxxx| 波多野结衣小视频| 欧美日韩aaaaa| 99免费在线视频| 精品国产凹凸成av人网站| 无码国产精品一区二区色情男同| 亚洲精品色婷婷福利天堂| 黄色大片在线免费观看| 色偷偷88888欧美精品久久久| 黄色网页网址在线免费| 欧美日韩福利视频| 中文日产幕无线码一区二区| 国产精品美女网站| 国产一区二区三区国产精品| 国产乱码一区| 欧洲乱码伦视频免费| 久久天天东北熟女毛茸茸| 亚洲国产精品第一区二区| 日本一极黄色片| 国模大尺度一区二区三区| 国产精品久久久久久亚洲色| 国产亚洲欧美一级| 国产1区2区3区4区| 色悠悠久久综合| 国产男男gay体育生白袜| 亚洲国产精品va在线看黑人动漫 | 中文字幕乱码亚洲精品一区| caoporn91| 五月婷婷久久丁香| 亚洲天堂手机在线| 精品国产精品一区二区夜夜嗨| 黄色软件在线| 久久99精品视频一区97| 成人黄色在线| 国产日韩欧美一区二区| 日本一区二区免费高清| 黄色www网站| 国模大尺度一区二区三区| 偷拍女澡堂一区二区三区| 亚洲天堂成人网| 亚洲综合图片网| 精品久久一区二区三区| 国产二区视频在线观看| 97精品国产91久久久久久| 成人97精品毛片免费看| 蜜桃成人在线| 亚洲午夜激情在线| 一路向西2在线观看| www成人在线观看| 国产一级视频在线| 8x8x8国产精品| 国产小视频福利在线| 91成人在线视频| 亚洲一区二区三区免费| 中文字幕一区二区三区最新| 三级影片在线观看欧美日韩一区二区 | 中文字幕乱码中文乱码51精品| 亚洲一区二区三区久久| 欧美日韩在线播放视频| 91视频最新入口| 成人禁用看黄a在线| 日本妇女毛茸茸| 91精品一区二区三区久久久久久 | 亚洲免费伊人电影| 亚洲一区二区影视| 亚洲天堂成人在线视频| 性感女国产在线| 九九九久久久| 99在线|亚洲一区二区| 大尺度在线观看| 一区二区三区四区乱视频| 国产精品探花视频| 日韩在线观看免费全集电视剧网站| 欧美1级2级| 日本不卡一区二区三区视频| 欧美专区18| 黑人巨大精品欧美| 狠狠躁18三区二区一区| 四虎在线视频免费观看| 91精品国产高清| 日本妇女一区| 免费在线观看毛片网站| 久久综合色天天久久综合图片| 日本在线播放视频| 亚洲精品永久免费精品| 成人欧美大片| 日本一区二区在线视频观看| 日本亚洲一区二区| 丁香六月激情综合| 91精品国产综合久久精品性色| 成人在线影视| 成人激情直播| 亚洲精选成人| 国产真实乱人偷精品人妻| 欧美三级在线看| 久久综合网导航| 91精品天堂| 亚洲人成人一区二区三区| 三级电影在线看| 欧美在线综合视频| 国产精品久久麻豆| 99国产高清| 国产精品三上| 一二三四国产精品| 日韩一区二区视频在线观看| 爱啪视频在线观看视频免费| 奇米视频888战线精品播放| 免费在线观看一区二区三区| 亚洲色婷婷一区二区三区| 亚洲激情视频在线| 日韩三级影视| 国产成人精品免费看在线播放| 粉嫩av亚洲一区二区图片| 久久久久久久久久久影院 | 欧美大片黄色| 久久久久久高清| 久久精品av麻豆的观看方式| 久草视频免费播放| 亚洲免费av网址| 国产美女精品视频免费播放软件 | 老司机精品视频在线| 久久国产在线观看| 亚洲欧美日韩在线高清直播| 日韩免费在线电影| 国产二级片在线观看| 亚洲国产精品av| 国产91绿帽单男绿奴| 国产精品久久久久久av福利软件| 亚洲精品久久久| 蜜臀av一区二区三区有限公司| 欧美日韩成人一区| 无码小电影在线观看网站免费| 午夜视频久久久| eeuss国产一区二区三区| 91亚洲欧美激情| 欧美性在线观看| 欧美日韩第一区| 国产熟女一区二区| 亚洲电影免费观看高清| 中文字幕日韩亚洲| 欧美 丝袜 自拍 制服 另类| 亚洲日本丝袜连裤袜办公室|