精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI秒破18世紀「天書」賬本!谷歌新模型盲測刷屏全網

人工智能 新聞
最近,谷歌AI Studio上的一個神秘模型不僅成功識別了200多年前一位商人的「天書」賬本,而且還修正了里面的格式錯誤和模糊表述,展現出的推理能力令歷史學家震驚。

悄悄地,谷歌已經解決了AI界的兩大古老難題?

前不久,谷歌AI Studio上的一個神秘模型引發網友關注,其中包括一位叫Mark Humphries的歷史學家。

他拿出了200多年前一位奧爾巴尼商人的「天書」賬本,來測試大模型在手寫文本識別(HTR)上的能力。

令人震驚的一幕出現了!

神秘模型不僅在自動手寫識別上接近滿分,還糾正了原賬本中的一個書寫格式錯誤,優化了其中一個可能引發歧義的模糊表述。

這意味著該模型不僅能識別字母,還可以理解字母背后的邏輯和知識背景。

而且,這些能力都是在模型未被提示的情況下展現出來的。

專家級的手寫文字識別能力,無需顯式規則的推理能力,這兩大難題的解決標志著AI模型能力上的一次躍遷。

網友推測,這個神秘模型可能就是谷歌即將在今年推出的Gemini-3,但尚未官方確認。

破解歷史學家難題

Mark Humphries是Wilfrid Laurier大學的一位歷史學教授。

作為一名歷史學家,他十分關心AI在自己的專業領域是否已經達到了人類專家級的推理水平。

因此,Humphries選擇了讓大模型來識別歷史手寫體,他認為這是檢驗大模型整體能力的一個黃金測試。

識別歷史手寫體,不僅是一個視覺任務,還要對歷史手稿所在的歷史背景有一定的了解。

如果缺乏這些知識,要準確識別和轉寫一份歷史文獻幾乎是不可能的。

在Humphries看來,這恰恰也是歷史文獻中最難識別的部分。

隨著大模型能力的發展,它們在HTR上的識別準確率可以超過90%,但剩下的10%才是最難,也是最關鍵的。

Humphries認為,如今的大模型(Transformer架構)在本質上是預測式的(其核心機制是預測下一個token),但歷史文獻中的拼寫錯誤和風格不一致,本來就是不可預測、低概率的答案。

因此,要把「the cat sat on the rugg」而不是「mat」轉寫出來,模型就必須逆著訓練分布的傾向來做。

這也是為什么大模型在轉寫不熟悉的人的名字(尤其姓氏)、冷門地名、日期或數字(比如金額)時不太擅長的原因。

比如,一封信是Richard Darby寫的,還是Richard Derby寫的?日期是1762年3月15日,還是1782年3月16日?賬單是339美元,還是331美元?

當歷史文獻中,出現這類難以辨認的字母或數字時,往往需要通過其他類型的背景知識來找到答案。

Humphries認為,這「最后一英里的準確性」,才是歷史手寫文本識別能被人類使用的前提。

預測式架構是否存在「天花板」?

為了衡量手寫轉寫準確性,Humphries與Lianne Leddy博士專門做了一個測試集,這是一個包含50份文檔、總計約1萬詞的集合。

并且,他們采取了一切合理的預防措施,盡可能確保這些文檔不在大模型的訓練數據里。

這個測試集包含了不同風格的書寫(從難以識別的潦草字跡到正式的秘書手寫體),以及各種工具拍攝的圖像。

在Humphries看來,這些文檔代表了他以及研究18、19世紀英語文獻的歷史學家最常遇到的類型。

他們用字符錯誤率(CER)和詞錯誤率(WER)來衡量轉寫錯誤的比例。

研究顯示,非專業人士通常WER在4-10%。

即便是專業的轉寫服務也預期會有少量錯誤,他們通常保證1%的WER,但前提是文本清晰易讀。

所以,這基本就是準確度的上限。

去年,在Humphries等人的測試集上,Gemini-2.5-Pro的表現為:

嚴格CER為4%,WER為11%。

當排除大小寫和標點的錯誤時,它們通常不會改變文本的實際含義,也不影響搜索與可讀性,這些錯誤率降到了CER 2%和WER 4%。

Humphries也發現,每一代模型的改進確實都在穩步發生。

Gemini-2.5-Pro的成績,已經比他們幾個月前測試的Gemini-1.5-Pro提升了約50-70%,后者又比最初測試的GPT-4提升了約50-70%。

這也印證了擴展規律的預期:

隨著模型變大,只憑模型規模就能大致預測它在這類任務上的表現。

新模型的表現

在同樣的數據集下,他們開始測試Google的新模型。

具體做法是上傳圖片到AI Studio,并輸入如下內容固定的提示詞:

「你的任務是準確轉寫手寫歷史文獻,盡可能降低CER和WER。逐字逐詞逐行工作,嚴格按照頁面上呈現的樣子轉寫文本。為保持歷史文本的真實性,保留拼寫錯誤、語法、句法和標點以及換行。轉寫頁面上的所有文本,包括頁眉、頁腳、邊注、插入內容、頁碼等。如果存在這些內容,請按作者標示的位置插入……」

Humphries在選擇測試文檔時,盡量挑選錯誤最多、最難辨認的那些文檔。

它們不僅手寫潦草,而且充滿拼寫與語法錯誤,缺乏恰當標點,大小寫極不一致。

目的很簡單,就是要探一下這個神秘模型的底。

最終,他挑了測試集中的5份文檔。

結果十分驚人。

該模型轉寫的5份文檔(總計剛過1000詞,約占樣本的十分之一),嚴格CER為1.7%,WER為6.5%。

也就是說包括標點和大小寫在內,大約每50個字符錯1個。

而且幾乎所有錯誤都在大小寫和標點,出錯的地方都是高度模糊,真正「詞」層面的錯誤非常少。

如果把這些類型的錯誤從計數中排除后,錯誤率降到了CER 0.56%和WER 1.22%。

也就是說,這個新的Gemini模型在HTR上的表現達到了人類專家級的水準。

秒破200多年前賬本「謎團」

隨后,Humphries決定繼續給新模型上強度。

他拿出了200多年前一位奧爾巴尼商人的日記賬。

這是一位荷蘭籍店員用英語記錄的流水賬。

他可能不太會說英語,拼寫和字母書寫極不規則,其中還夾雜著荷蘭語與英語。

賬目也用舊式英鎊/先令/便士寫法,并采用當時常見的速記格式:「To 30 Gallons Rum @4/6 6/15/0」。

這表示有人購買了(記入其賬戶的借方)30加侖朗姆酒,每加侖4先令6便士,總計6英鎊15先令0便士。

對于今天的大多數人來說,這種非十進制貨幣單位很陌生:1先令等于12便士,1英鎊等于20先令。

單筆交易隨時記到賬上,用橫線分隔,中間寫當天日期數字。

每筆交易記成借記(Dr,購買)或貸記(Cr,付款)。

有些交易被劃掉,可能表示已對賬或轉入總賬里的客戶賬戶(類似「待處理」變「已入賬」)。

這些記錄還無標準格式。

大模型在處理這種賬本時一直容易出問題。

不僅因為相關訓練數據很少,還因為其中沒有太多規律可言:人可以買任意數量的任何東西,單價可以是任意的,而總價并不按常規方法湊整。

大模型往往能辨出一些名字和一些商品,但在數字上完全迷失。

比如,它們通常難以準確轉寫數字,而且傾向于把單價與總價混在一起。

尤其是一些復雜的頁面會暫時「搞崩」模型:讓它不斷重復某些數字或短語,或者有時干脆失敗不答。

然而,Humphries在谷歌的新模型中,卻看到它在識別奧爾巴尼商人日記賬頁面時表現接近完美。

不僅數字部分驚人地全都正確,更有意思的它還糾正了原來店員記賬時的一個格式上的小錯誤。

比如,Samuel Stitt買了2個潘趣酒碗,店員記為每個2/,意思是每個2先令;為省事,他省略了「0便士」。但為了保持一致,模型把它轉寫為@2/0,這其實更規范也更清楚。

通讀文本,Humphries還看到一個讓他汗毛直豎的「錯誤」。

他看到Gemini把一行「To 1 loff Sugar 145 @ 1/4 0 19 1」的原文轉寫為「To 1 loff Sugar 14 lb 5 oz @ 1/4 0 19 1」。

18世紀的糖以硬化的錐形糖錠出售,Slitt先生是個店主,大量購入糖用于轉賣。

乍看之下,這像是一次幻覺式錯誤:模型被要求嚴格按原文轉寫,但它插入了原文沒有的「14 lb 5 oz」。

仔細考證后,Humphries意識到大模型做了極其聰明的事。

Gemini正確推斷出1、4、5是重量單位構成的數值,描述所購糖的總重量。

為了確定正確的重量、解碼145,Gemini還利用最終總價0/19/1反推重量,這需要在兩套十進制體系與兩套非十進制體系之間來回換算。

Humphries推測了大模型的推理過程:

糖的單價是1先令4便士每單位,也就是16便士。交易總價是0英鎊、19先令、1便士,可換算為229便士。

要算買了多少糖,就用229除以16,得到14.3125,或14磅5盎司。

于是,Gemini斷定它不是「1 45」,也不是「145」,而是「14 5」,進而是14 lb 5 oz,并在轉寫中予以澄清。

在Humphries的測試中,沒有其他模型在被要求轉寫同一文檔時做出過類似表現。

這個例子之所以引起Humphries注意,是因為AI似乎跨過了一些專家長期聲稱現有模型無法越過的邊界。

面對一個含糊的數字,它能夠推斷出缺失的上下文,在歷史貨幣與重量系統之間執行了一系列多步換算,并得到一個正確結論,這個過程需要對文獻所描述的世界進行抽象推理。

Humphries認為其中發生的可能是一種涌現的、隱式的推理,是在一個統計模型內部,自發地把感知、記憶與邏輯組合起來,而不是被專門設計成以符號方式推理,雖然他還不清楚背后的具體原理。

如果這一假設成立,Humphries認為「糖錠條目」不僅是一段了不起的轉寫,更發出了一個小而清晰的信號:模式識別開始跨越真正「理解」的界限。

這說明大模型不僅能以人類專家級的準確度轉寫歷史文獻,也開始展示出對這些歷史文獻背后經濟與文化系統的理解。

Humphries認為這也許揭示了另一件事的開端:機器開始能就它們所見的世界,進行真正的抽象、符號化推理。

責任編輯:張燕妮 來源: 新智元
相關推薦

2017-09-11 10:37:56

編程語言名單

2024-04-22 11:40:50

2013-06-03 10:18:59

WindowsLinux微軟Office

2019-10-08 10:35:53

編譯Linux內核

2011-04-20 13:14:33

BlackBerry黑莓RIM

2013-06-03 09:36:24

21世紀代碼寫代碼

2022-11-14 12:38:29

2010-05-06 10:08:05

Adobe CTO蘋果

2013-05-21 16:20:40

2020-12-22 09:42:47

生物識別網絡安全

2020-03-23 13:43:00

數據科學家大數據數據

2012-10-09 13:41:09

數據科學家職業

2020-04-10 10:11:15

數據泄露漏洞信息安全

2024-10-29 12:38:17

ChatGPTGrok圖像

2011-02-17 14:27:16

WindowsMac

2020-01-08 13:40:01

戴爾

2013-11-20 11:35:44

SAP中國商業同略會

2021-11-03 21:00:19

智能建筑物聯網

2014-09-18 10:23:00

程序員

2018-12-10 07:22:27

物聯網預測分析安全威脅
點贊
收藏

51CTO技術棧公眾號

在线精品国产欧美| 欧美性猛交xxxx乱大交极品| 亚洲一区二区三区乱码aⅴ| 91视频综合网| 日韩啪啪网站| 欧美日本一区二区三区四区| 男人添女人下部视频免费| 午夜性色福利影院| 韩国理伦片一区二区三区在线播放| 欧美激情免费观看| 美国一级黄色录像| 国产伦乱精品| 777a∨成人精品桃花网| 99爱视频在线| 9191在线播放| 久久精品综合网| 高清不卡一区二区三区| 中文字幕一区二区三区波野结 | 成人精品小蝌蚪| 国产成人精品在线播放| 九九热精品免费视频| 国产欧美日韩精品一区二区三区 | 91在线视频一区| 国产原创视频在线| 欧美特黄a级高清免费大片a级| 亚洲精品中文字| 韩国三级hd中文字幕有哪些| 精品网站在线| 欧美日韩精品国产| 国产aaa免费视频| 黄色在线视频网站| 国产欧美日韩视频在线观看| 国内精品二区| www.国产免费| 国产一区二区三区在线观看免费| 欧美伊久线香蕉线新在线| 免费又黄又爽又色的视频| 俺要去色综合狠狠| 亚洲欧美在线免费| 国产精品无码电影| 国产成人夜色高潮福利影视| 欧美精品久久99| 一区二区三区入口| 日日夜夜天天综合| 色妞www精品视频| 91猫先生在线| 韩国成人动漫| 日韩欧美国产高清91| 无码中文字幕色专区| 欧美6一10sex性hd| 亚洲精品va在线观看| 青少年xxxxx性开放hg| 日本蜜桃在线观看| 国产精品黄色在线观看| 视频一区三区| 91在线视频| 国产精品久久久久影院色老大 | 在线观看成人免费视频| 黄色片一级视频| 中文字幕乱码中文乱码51精品| 精品久久久久久国产91| 国产男女在线观看| 国产精品专区免费| 欧美影片第一页| 91制片厂毛片| 996久久国产精品线观看| 欧美精品自拍偷拍| 一起草最新网址| 成人直播在线观看| 日韩电影免费观看在线观看| 性欧美13一14内谢| 日韩精品免费一区二区在线观看 | 国产亚洲精品码| 亚洲激情一区| 欧洲精品久久久| 精品无码一区二区三区的天堂| 日韩电影在线免费观看| 成人免费观看a| 午夜精品小视频| 91麻豆123| 视频在线精品一区| 超碰在线caoporen| 天天综合日日夜夜精品| 日本熟妇人妻xxxxx| 国产福利91精品一区二区| 欧美一二三区在线| 国产 中文 字幕 日韩 在线| 精品国产91乱码一区二区三区四区| 影音先锋日韩有码| 免看一级a毛片一片成人不卡| 1024成人| 国产精品三级久久久久久电影| 91中文字幕在线播放| 不卡的看片网站| 色999日韩自偷自拍美女| 18av在线视频| 色88888久久久久久影院按摩| 自拍偷拍一区二区三区四区| 一级毛片精品毛片| 亚洲性夜色噜噜噜7777| 青青草激情视频| 久久久www| av成人免费观看| 欧美高清电影在线| 亚洲精品免费在线播放| 日本熟妇人妻xxxxx| 久久一级大片| 亚洲午夜女主播在线直播| 久久久精品国产sm调教网站| 日本亚洲视频在线| 国产精品制服诱惑| gogogogo高清视频在线| 一本大道av一区二区在线播放| 亚洲高清av一区二区三区| 九九综合久久| 午夜免费日韩视频| 国产婷婷在线视频| 国产女人18水真多18精品一级做| 一卡二卡三卡视频| 亚洲热av色在线播放| 亚洲热线99精品视频| 精品无码黑人又粗又大又长| 美女网站一区二区| 欧美日韩一区二区视频在线| 波多野结衣在线观看| 555夜色666亚洲国产免| 一级片久久久久| 午夜一区不卡| 国产精选一区二区| 蜜臀av在线| 日韩一区二区三区电影在线观看| 国产又黄又粗的视频| 鲁大师成人一区二区三区| 国产精品一区二区av| 任你弄在线视频免费观看| 欧美老女人第四色| 美国一级黄色录像| 日本女人一区二区三区| 欧美日韩国产高清视频| 麻豆mv在线看| 欧美精品一区二区三区蜜桃 | 欧美精品午夜| 国产日韩欧美视频在线| 高h视频在线| 在线观看网站黄不卡| 自拍偷拍中文字幕| 久久av最新网址| 免费国产在线精品一区二区三区| 国产乱码精品一区二三赶尸艳谈| 精品久久人人做人人爱| 久视频在线观看| 国产suv一区二区三区88区| 欧美在线观看视频免费| theporn国产在线精品| 久久久久中文字幕| 五月天婷婷视频| 日韩欧美亚洲范冰冰与中字| 国产呦小j女精品视频| 天堂在线一区二区| 日韩一区免费观看| 欧美日韩伦理一区二区| 色妞久久福利网| 国产伦理一区二区| 一区二区三区成人| 亚洲av成人片色在线观看高潮| 国产精品日韩久久久| 欧美精品与人动性物交免费看| 亚洲国产欧美日本视频| 中文字幕欧美精品日韩中文字幕| 亚洲一区二区视频在线播放| 亚洲欧美视频在线观看视频| 久久久国产精品久久久| 亚洲伦理精品| 日韩欧美亚洲日产国| 日韩一区中文| 欧美激情免费视频| 欧美大片aaa| 欧美欧美欧美欧美| 精品一区在线视频| 久久天堂av综合合色蜜桃网| 亚洲一级免费观看| 欧美日韩国产成人精品| 久久本道综合色狠狠五月| 欧美123区| 欧美国产日韩二区| 黄色在线网站| 91精品国产日韩91久久久久久| 精品少妇爆乳无码av无码专区| 26uuu精品一区二区三区四区在线 26uuu精品一区二区在线观看 | 亚洲精品国产日韩| 日韩欧美99| 一区二区三区在线资源| 日韩av电影在线网| 最新国产在线拍揄自揄视频| 日韩大陆毛片av| 国产有码在线观看| 欧美日韩国产限制| 国产一区二区播放| 欧美激情中文不卡| 久久人妻少妇嫩草av蜜桃| 老牛嫩草一区二区三区日本| 奇米777四色影视在线看| 国产精品密蕾丝视频下载| 69堂成人精品视频免费| 久久野战av| 久久久久久亚洲| 看黄网站在线观看| 国产亚洲福利一区| 狠狠躁日日躁夜夜躁av| 欧美卡1卡2卡| 波多野结衣不卡| 欧美日韩国产黄| 欧产日产国产v| 中文字幕av一区 二区| 99久久人妻精品免费二区| 国产九九视频一区二区三区| 日韩精品一区二区三区色欲av| 欧美在线国产| 亚洲一区二区在线看| 亚洲影院天堂中文av色| 成人看片视频| 中文字幕综合| 国产精品一区二区三区在线播放| 国产99在线| 久久久之久亚州精品露出| 国产在线观看a| 亚洲人高潮女人毛茸茸| 污污网站在线免费观看| 日韩精品专区在线影院重磅| 国产影视一区二区| 精品视频色一区| 免费在线不卡av| 欧美三级欧美成人高清www| 国产无遮挡裸体免费视频| 亚洲美女区一区| 老熟妇高潮一区二区三区| 中文字幕在线观看一区| 一二三四国产精品| 国产日本亚洲高清| 国产 欧美 在线| 91年精品国产| 你懂得在线视频| 91蜜桃在线观看| 在线视频 日韩| 成人在线视频首页| 天天躁日日躁狠狠躁av麻豆男男| 国产一二精品视频| 午夜不卡福利视频| 国产在线不卡一卡二卡三卡四卡| 高潮一区二区三区| 麻豆精品一区二区av白丝在线| 精品久久久噜噜噜噜久久图片| 日韩黄色小视频| 天天干在线影院| 久久99国产精品麻豆| 性欧美在线视频| 国产成人免费视频| 无码成人精品区在线观看| 成人福利电影精品一区二区在线观看| 中文字幕视频观看| 成人免费观看av| 国产精品无码一区二区三区免费| 91美女在线视频| 日本精品在线观看视频| 国产精品久久久久久福利一牛影视| 粉嫩精品久久99综合一区| ...av二区三区久久精品| 欧美成人黄色网| 精品国产91乱高清在线观看| 国产高清中文字幕| 欧美视频精品在线| 国产免费黄色网址| 亚洲国产高清高潮精品美女| 欧美一区二区少妇| 日韩有码视频在线| segui88久久综合| 国产成人一区三区| 久久99成人| 欧美极品一区二区| 国产精品成人a在线观看| av动漫在线免费观看| 亚洲视频播放| 久久久久久久片| 国产精品主播直播| 亚洲欧美色图视频| 国产精品久久久久久久久图文区 | 蜜桃视频在线观看www社区| 欧美成人在线免费| 欧美人体一区二区三区| 91亚洲va在线va天堂va国| 精品无人区一区二区| 视频在线观看成人| 亚洲激情网站| 国产美女18xxxx免费视频| 成人av在线一区二区三区| 丁香激情五月少妇| 亚洲成年人网站在线观看| 伊人免费在线观看| 精品福利视频一区二区三区| 久久这里精品| 欧美成人免费全部| 日韩三区免费| 精品中文字幕人| 天天影视欧美综合在线观看| 日日鲁鲁鲁夜夜爽爽狠狠视频97| 国产在线乱码一区二区三区| 国产免费一区二区三区网站免费| 亚洲黄网站在线观看| 国产女主播喷水视频在线观看| 欧美videofree性高清杂交| 第一福利在线| 97成人超碰免| 亚洲电影一区| 亚洲图片都市激情| 免费视频一区二区三区在线观看| 欧美熟妇另类久久久久久多毛| 国产区在线观看成人精品| 九九热在线免费观看| 日韩天堂在线观看| 三区四区电影在线观看| 国产va免费精品高清在线观看| 成人午夜网址| 欧美在线观看视频免费| 国模娜娜一区二区三区| 男人天堂资源网| 欧洲精品视频在线观看| 天堂成人在线| 欧美亚洲第一区| 精品国产乱子伦一区二区| 欧美日韩午夜爽爽| 精品一区二区三区在线观看国产| 99久久久无码国产精品性 | 日韩av资源在线| 成人18视频日本| 国产无套粉嫩白浆内谢| 欧美精品一区二区在线播放| caopon在线免费视频| 91九色在线视频| 99精品美女| а 天堂 在线| 亚洲精品久久久久久国产精华液| 国产欧美日韩综合精品一区二区三区 | 欧美日韩午夜视频在线观看| 人妻妺妺窝人体色www聚色窝 | 日本精品网站| 欧美资源一区| 免费的国产精品| 激情高潮到大叫狂喷水| 欧美日韩亚洲高清一区二区| 99中文字幕一区| 国产在线播放91| 在线精品小视频| 国产精九九网站漫画| 亚洲一卡二卡三卡四卡无卡久久| 好吊视频一区二区三区| 国产+成+人+亚洲欧洲| 秋霞影院一区二区三区| 欧美色图另类小说| 久久精品人人爽人人爽| 中文字幕一区二区三区人妻四季| 日韩在线免费高清视频| 91久久青草| 成年人网站国产| 久久综合九色综合欧美就去吻 | 欧美一区午夜精品| 欧美人与牲禽动交com| 国产欧美欧洲| 裸体素人女欧美日韩| 91香蕉视频污在线观看| 日韩一区二区三区在线| caoprom在线| 手机看片福利永久国产日韩| 精品亚洲欧美一区| 国产乡下妇女做爰| 亚洲欧美另类国产| 成人短视频软件网站大全app| 日本a在线天堂| 久久久午夜精品理论片中文字幕| 少妇又紧又色又爽又刺激视频 | 男女啪啪999亚洲精品| 中国一级大黄大黄大色毛片| 不卡在线观看av| 中文在线资源天堂| 欧美黑人xxxⅹ高潮交| 九九亚洲视频| 老司机av网站| 色婷婷一区二区| 精精国产xxxx视频在线中文版 | 国产免费一区二区三区最新6| 日韩欧美成人区| 中日韩高清电影网| 日本一区视频在线观看| 国产91丝袜在线播放| 中日韩av在线| 97在线视频免费播放| 久久精品国产亚洲夜色av网站 | 欧美一级淫片videoshd| 婷婷精品进入| 青青草福利视频| 精品精品国产高清一毛片一天堂|