精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

谷歌開源首個「方言」數據集:讓機器翻譯更地道

人工智能
研究人員根據博客和教育網站手動收集了20-30個具有地區特色的翻譯術語,并根據來自每個地區的母語志愿者的反饋對翻譯進行過濾和審核。

雖然全中國的人都在說漢語,但具體到各地的方言卻略有不同,比如同樣是小巷的意思,「胡同」一開口就知道是老北京了,而到了南方則叫「弄」。

這種細微的地域性差異反應在「機器翻譯」任務上,就會顯得翻譯結果不夠「地道」,而目前幾乎所有的機器翻譯系統都沒有考慮地區性語言(即方言)的影響。

而在世界范圍內也存在這種現象,比如巴西的官方語言是葡萄牙語,跟歐洲的葡萄牙語之間也有一些地域性差異。

最近谷歌發布了一個全新的,可用于Few-shot Region-aware機器翻譯的數據集和評估基準FRMT,主要解決方言翻譯問題,論文發表在TACL(Transactions of the Association for Computational Linguistics)上。

圖片

論文鏈接:https://arxiv.org/pdf/2210.00193.pdf

開源鏈接:https://github.com/google-research/google-research/tree/master/frmt

該數據集包括從英語到葡萄牙語和中文普通話的兩個地區變體的專業翻譯,源文檔是為了能夠詳細分析感興趣的現象,包括詞匯上不同的術語和干擾術語。

研究人員探索了 FRMT 的自動評估指標,并在區域匹配和不匹配評分情景下驗證了其與專家人工評估的相關性。

最后,為這項任務提出了一些基線模型,并為研究人員如何訓練、評估和比較自己的模型提供指導建議,數據集和評估代碼已開源。

Few-Shot泛化

大多數現代機器翻譯系統都經過數百萬或數十億翻譯樣本的訓練,輸入數據包括英語輸入句及其相應的葡萄牙語翻譯。

然而,絕大多數可用的訓練數據并沒有說明翻譯的地區差異。

鑒于這種數據稀缺性,研究人員將 FRMT 定位為few-shot翻譯的基準,當給定每種語言不超過100個帶標簽的例子時,測量機器翻譯模型識別出指定區域語言變體的能力。

機器翻譯模型需要根據少量標記過的樣本(即范例)中顯示的語言模式,來識別出其他未標記訓練樣本中的相似模式。模型需要通過這種方式進行泛化,從而生成模型中沒有明確指定區域的「地道」翻譯結果。

圖片

比如輸入句子:The bus arrived,再給定幾個巴西葡萄牙語的例子,模型應該能翻譯出「O ?nibus chegou」;如果給的樣例是歐洲葡萄牙語,模型的翻譯結果應該變為「O autocarro chegou」。

機器翻譯的few-shot方法是很有研究價值的,能夠以一種非常簡單的方式來對現有系統中增加對額外區域語言的支持能力。

雖然谷歌目前發表的工作是針對兩種語言的區域變體,但研究人員預測,一個好的方法將很容易適用于其他語言和區域的變體。

從原理上來說,這些方法也適用于其他語言差異現象,例如禮節和風格等。

數據收集

FRMT 數據集包括部分英文維基百科文章,來源于 Wiki40b 數據集,這些文章已經由付費的專業翻譯人員翻譯成不同的地區性的葡萄牙語和漢語。

圖片

為了突出關鍵區域感知的翻譯難題,研究人員使用了三個內容桶(content buckets)來設計數據集:

1. 詞匯 Lixical

詞匯桶主要關注不同地區在詞匯選擇上的差異,例如當把一個帶有單詞「bus」的句子分別翻譯成巴西語和歐洲葡萄牙語時,模型需要能夠識別出「?nibus」與「autocarro」的區別。

研究人員根據博客和教育網站手動收集了20-30個具有地區特色的翻譯術語,并根據來自每個地區的母語志愿者的反饋對翻譯進行過濾和審核。

根據得到的英語術語列表,從相關的英語維基百科文章(例如,bus)中提取出100個句子。再對普通話,重復上述相同的的收集過程。

圖片

2. 實體 Entity

實體桶以類似的方式填充,涉及的人、位置或其他實體與某一特定語言所涉兩個區域之一有著密切聯系。

比如給定一個說明性的句子,如「In Lisbon, I often took the bus.」(在里斯本,我經常坐公共汽車。),為了正確地將其翻譯成巴西葡萄牙語,模式必須能夠識別出兩個潛在的陷阱:

1)里斯本和葡萄牙之間更密切的地理關聯可能會影響模型翻譯的選擇,從而幫助模型判斷出應該翻譯成歐洲葡萄牙語而非巴西葡萄牙語,即選擇「autocarro」而不是「?nibus」。

2)用「巴西利亞」代替「里斯本」可能是一個比較簡單的方式,對于同一個模式,對巴西葡萄牙語本地化其輸出,即便翻譯結果仍然很流暢,但也可能會導致不準確的語義。

3. 隨機 Random

隨機桶用于檢查一個模型是否正確處理了其他不同的現象,包含從維基百科的featured和good)集合中隨機抽取的100篇文章。

圖片

系統性能

為了驗證為 FRMT 數據集收集的翻譯能夠捕獲特定區域的現象,研究人員對數據質量進行了人工評估。

來自每個相應區域的專家標注員使用多維質量度量(MQM)框架來識別和分類翻譯中的錯誤:該框架包括一個分類加權方案,將識別出的錯誤轉換成一個單一的分數,粗略地表示每句話的主要錯誤數量,即數值越小表示翻譯越好。

對于每個地區,研究人員要求 MQM 評分者對來自他們所在地區的翻譯和來自他們語言的其他地區的翻譯進行評分。

例如,巴西的葡萄牙語評分員同時對巴西和歐洲的葡萄牙語譯本都進行了評分,兩個分數之間的差異表明語言現象的普遍性,即該語言變體是否可接受,而并非是另一種語言。

實驗結果發現,在葡萄牙語和漢語中,評分者平均比匹配的譯文中每個句子多發現大約兩個主要錯誤,表明FRMT數據集確實能夠捕獲特定區域的語言現象。

雖然人工評估是確保模型質量的最佳方法,但其往往是緩慢且昂貴的。

因此,研究人員希望找到一個現成的自動度量指標,可以用來評估模型在基準中的性能,研究人員考慮選擇使用 chrF,BLEU 和 BLEURT.

圖片

根據 MQM 評估者對幾個基線模型翻譯結果的評分,可以發現 BLEURT 與人類判斷具有最好的相關性,并且該相關性的強度(0.65 Pearson 相關系數,ρ)與標注者間一致性(0.70組內相關性)相當。

系統性能

文中評估了一些最近發布的、具有few-shot控制能力的模型。

基于 MQM 的人類評估,基線方法都表現出一定的localize葡萄牙語輸出的能力,但是對于中文普通話,大多沒有利用目標地區的知識來生成優秀的當地翻譯結果。

在評估的基準中,谷歌的語言模型 PaLM 模型的性能最佳,為了使用 PaLM 生成針對區域的翻譯,首先將一個有指導意義的提示輸入模型,然后從中生成文本以填充空白。

圖片

PaLM 僅通過一個例子就獲得了很好的結果,在葡萄牙語方面,當增加到10個例子時,質量略有提高,考慮到 PaLM 是在無監督的情況下進行訓練的,這種表現已經非常好了。

研究結果還表明,像 PaLM 這樣的語言模型可能特別擅長記憶流暢翻譯所需的特定區域的詞匯選擇。

圖片

然而,在 PaLM 和人類之間仍然存在顯著的性能差距。

參考資料:

https://ai.googleblog.com/2023/02/frmt-benchmark-for-few-shot-region.html

責任編輯:武曉燕 來源: 新智元
相關推薦

2020-10-11 22:05:22

機器翻譯谷歌AI

2020-04-02 15:51:40

翻譯神經網絡人工智能

2022-05-24 09:57:32

微軟開源AI 驅動

2017-09-05 14:23:22

人工智能機器翻譯神經網絡

2017-04-06 10:40:49

機器學習開源Python庫

2022-05-26 15:00:36

翻譯模型谷歌

2017-08-21 16:00:14

機器學習機器翻譯

2017-03-22 12:39:33

人工智能機器翻譯

2020-05-07 17:03:49

Python編碼開發

2024-06-13 09:05:36

2023-10-12 18:39:57

火山引擎

2021-10-13 18:59:42

AI

2021-10-13 18:57:59

AI

2021-06-17 10:28:42

谷歌開源轉譯器

2015-02-27 09:20:17

Android黑莓谷歌

2015-02-27 09:29:50

Android

2018-08-22 11:42:36

搜狗

2021-10-28 17:52:51

機器翻譯人工智能AI

2019-10-25 16:18:34

機器學習人工智能計算機

2012-02-09 09:49:48

點贊
收藏

51CTO技術棧公眾號

在线观看91精品国产麻豆| 2020日本不卡一区二区视频| 精品国产依人香蕉在线精品| 亚洲免费成人在线视频| 欧美xxxx黑人又粗又长| 99精品欧美一区二区蜜桃免费 | 无码一区二区三区在线| 欧美亚洲福利| 精品色蜜蜜精品视频在线观看| 日本福利一区二区三区| 精品人妻一区二区三区换脸明星 | 精品久久对白| 欧美亚洲高清一区二区三区不卡| 97超碰免费观看| 天堂а√在线8种子蜜桃视频| 美女一区二区三区在线观看| 黑人精品视频| 欧美国产激情| 亚洲欧美日韩精品久久亚洲区| www.久久久久久久久久久| 成年男女免费视频网站不卡| 国产精品国产三级国产普通话蜜臀| 国产91社区| 一级做a爱片性色毛片| 在线亚洲成人| 欧美日韩成人网| 特级西西www444人体聚色| 日韩一区二区三区高清在线观看| 在线中文字幕一区二区| 国产一线二线三线女| porn亚洲| 久久网这里都是精品| 97se在线视频| 国产精品视频一二区| 久久久久久穴| 91豆花精品一区| 免费网站看av| 久久精品国产亚洲夜色av网站| 日韩电影中文字幕在线观看| 又黄又色的网站| 不卡一区视频| 在线播放视频一区| 蜜桃免费在线视频| 亚洲成人看片| 狠狠躁夜夜躁人人爽天天天天97 | 国产精品一二区| 亚洲GV成人无码久久精品| 亚洲二区视频| 久久久久女教师免费一区| 美女福利视频在线观看| 亚洲精品a级片| 久久这里有精品视频| 中国一级片在线观看| 99久久婷婷这里只有精品| 国产亚洲xxx| 亚洲熟妇一区二区三区| 亚洲动漫精品| 亚洲欧洲免费视频| 波多野结衣 在线| 色棕色天天综合网| 亚洲视频在线视频| 免费看黄色的视频| 精品一区欧美| 中文在线资源观看视频网站免费不卡| 日本二区在线观看| 青青草91久久久久久久久| 在线日韩欧美视频| 三级在线观看免费大全| 欧美日韩国产欧| 久久久久久国产精品三级玉女聊斋| 日本少妇高清视频| 日韩欧美一区二区三区久久婷婷| 国产一二三区在线视频| 国产精品久久久久久福利一牛影视| 日韩中文不卡| 蜜桃av在线免费观看| 亚洲精品美腿丝袜| 欧美 国产 综合| 日韩伦理三区| 欧美人与性动xxxx| 麻豆传媒在线看| 欧美美女黄色| 在线精品高清中文字幕| 人人澡人人澡人人看| 极品少妇一区二区三区| 欧美一区二区三区免费视| 国产成人麻豆免费观看| 韩国女主播成人在线| 99国内精品久久久久久久软件| 欧洲av在线播放| 久久久蜜桃精品| 中文字幕人成一区| www.youjizz.com在线| 色婷婷综合久久久中文一区二区| 午夜国产一区二区三区| 欧美黄视频在线观看| 亚洲精品福利免费在线观看| 林心如三级全黄裸体| 欧美视频成人| 国产成人一区二区| www.国产免费| 国产日产欧美一区| 免费看日b视频| 精品91久久| 91精品国产综合久久香蕉麻豆| 这里只有精品在线观看视频| 成人情趣视频| 欧美激情一二区| 中文无码av一区二区三区| 国产精品456| 欧美一区二区三区在线播放 | 亚洲品质自拍| 久久av红桃一区二区小说| 草久视频在线观看| 国产一区二区成人久久免费影院 | 色97色成人| 97婷婷涩涩精品一区| 国产精品久久久久久久免费| 91视视频在线观看入口直接观看www | 亚洲一区在线观| 久久无码av三级| 欧美大黑帍在线播放| 国产日本久久| 亚洲性69xxxbbb| 成人免费视频毛片| 成人中文字幕合集| 佐佐木明希av| 四虎国产精品免费久久| 亚洲天堂av在线免费| 欧美精品亚洲精品日韩精品| 国产99久久久国产精品免费看 | 91精品久久久久久久久| 丝袜+亚洲+另类+欧美+变态| 亚洲精品欧美在线| 91精品999| 精品国内自产拍在线观看视频| 91精品国产91久久久久| 日韩在线视频观看免费| 一区二区三区高清| 欧美日韩久久婷婷| 99精品电影| 国产日韩欧美在线观看| av福利精品| 在线观看三级视频欧美| 小早川怜子久久精品中文字幕| 日韩视频一区二区三区在线播放免费观看| 亚洲一区二区自拍| www在线免费观看视频| 91精品国产综合久久久蜜臀粉嫩| 国产美女久久久久久| 久久精品国产精品亚洲精品| 亚洲一区二区三区在线观看视频 | 成人天堂噜噜噜| 香港伦理在线| 777午夜精品视频在线播放| 日韩三级久久久| 黄一区二区三区| 五月天综合婷婷| 成人综合日日夜夜| 欧美成年人视频| 精品黑人一区二区三区国语馆| 1024成人网| 中文字幕av一区二区三区人妻少妇| 亚洲一级淫片| 99久久国产免费免费| 国产探花视频在线观看| 精品国产三级a在线观看| 538精品在线观看| 懂色av一区二区三区免费观看| 日韩 欧美 视频| 色橹橹欧美在线观看视频高清| 青青草国产精品一区二区| 韩日在线视频| 欧美日韩国产欧美日美国产精品| 污软件在线观看| 成人免费看的视频| 欧美激情国产精品日韩| 久久理论电影| 粉嫩高清一区二区三区精品视频 | 亚洲国产精品天堂| 韩国无码一区二区三区精品| 天堂成人免费av电影一区| 图片区小说区区亚洲五月| 精品国产鲁一鲁****| 国模极品一区二区三区| 激情小视频在线观看| 欧美日韩国产不卡| 久久无码精品丰满人妻| 久久欧美一区二区| theporn国产精品| 黄色另类av| 亚洲成色最大综合在线| 亚洲开心激情| 国产精品久久电影观看| 日韩欧美一起| 在线播放国产精品| 老牛影视av牛牛影视av| 欧美中文字幕亚洲一区二区va在线| 欧洲猛交xxxx乱大交3| 26uuu另类欧美| 国产精品嫩草影视| 日韩黄色片在线观看| 黑人巨茎大战欧美白妇| 国产成人3p视频免费观看| 91免费欧美精品| 性国裸体高清亚洲| 久久国产精品久久精品| 日本精品专区| 欧美一区二区三区免费大片 | aⅴ色国产欧美| 在线播放 亚洲| 亚洲精品国产setv| 成人激情直播| 精品亚洲a∨| 91高清视频免费| 欧美xxxx性xxxxx高清| 日韩少妇与小伙激情| 欧美日韩激情视频一区二区三区| 717成人午夜免费福利电影| jizz国产在线观看| 亚洲成a人v欧美综合天堂下载| 国产白丝一区二区三区| 久久久久久久久久电影| 亚洲国产精品狼友在线观看| 激情久久久久久久久久久久久久久久 | 在线中文资源天堂| 亚洲精品ady| 国内精品偷拍视频| 欧美日韩精品福利| 国产主播第一页| 欧美网站在线观看| 日韩av黄色片| 亚洲午夜电影网| 精品国产乱码久久久久久鸭王1| 国产精品国产三级国产a| 欧美熟妇激情一区二区三区| 99r精品视频| www.88av| 91亚洲国产成人精品一区二区三| 乱码一区二区三区| 国产成人免费视| 日本成人xxx| 国产一区二区三区综合| 欧美国产日韩另类 | 免费看三级黄色片| 国产综合色精品一区二区三区| 日本肉体xxxx裸体xxx免费| 首页国产欧美久久| 欧洲av无码放荡人妇网站| 亚洲精品韩国| 国产精品-区区久久久狼| 国产精品亚洲综合久久| 男女av免费观看| 久久蜜桃精品| 亚洲黄色av网址| 久久9热精品视频| 婷婷激情小说网| 国产成人综合在线播放| 日本性生活一级片| 91视频国产资源| 色哟哟精品观看| 国产精品久久久久久久蜜臀| 亚洲一二三四五六区| 中文字幕在线一区二区三区| av资源在线免费观看| 亚洲乱码中文字幕| 黄色小视频在线免费看| 姬川优奈aav一区二区| 在线天堂中文字幕| 欧美日韩在线直播| 国产成人免费看一级大黄| 欧美精品一区二区三区在线| 天堂在线免费av| 久久精品一二三| 一区二区在线免费| 成年人网站免费看| 欧美激情一区二区三区蜜桃视频| 日本人亚洲人jjzzjjz| 国产精品色哟哟网站| 五月婷婷一区二区| 午夜精品久久久久| 超碰在线观看91| 91麻豆精品91久久久久久清纯 | 久久精品国产成人一区二区三区| 色偷偷中文字幕| 99视频有精品| 久草福利资源在线| 亚洲成人自拍网| 瑟瑟视频在线免费观看| 日韩精品一区在线| 免费黄网站在线观看| 精品国产一区二区三区四区在线观看| 婷婷在线播放| 国产福利精品视频| 网站一区二区| 欧美一级二级三级九九九| 天天av综合| 情侣黄网站免费看| 国产精品香蕉一区二区三区| 欧美精品黑人猛交高潮| 亚洲欧美一区二区在线观看| 日本系列第一页| 欧美巨大另类极品videosbest| 亚洲精品一区二区三区区别| 伊人精品在线观看| 丁香花在线影院| 国产伦精品免费视频| 羞羞答答一区二区| 亚洲小视频在线播放| 久久美女性网| 第一页在线视频| 国产精品色哟哟| 日产精品久久久| 欧美大片顶级少妇| 日本在线观看视频| 欧美中文字幕在线视频| 日韩中文字幕在线一区| 日本10禁啪啪无遮挡免费一区二区| 午夜天堂精品久久久久| 国产又黄又猛又粗| 久久久综合九色合综国产精品| 天天干中文字幕| 欧美日韩一区二区三区视频| 亚洲三区在线播放| 久久久噜噜噜久噜久久| 九九九九九九精品任你躁| 亚洲v日韩v欧美v综合| 久久精品亚洲一区二区| 偷偷色噜狠狠狠狠的777米奇| 亚洲美女视频在线| 国产老女人乱淫免费| 色777狠狠综合秋免鲁丝| 久久人体大尺度| 久久久婷婷一区二区三区不卡| 亚洲成人中文| 极品白嫩的小少妇| 一个色在线综合| 国产高潮在线观看| 久久精品99国产精品酒店日本 | 在线观看视频免费一区二区三区| 女人高潮一级片| 国产精品色在线观看| 最近中文字幕在线观看| 亚洲天堂av网| 日韩av超清在线观看| 色综合久久久久久久久五月| 日韩精品乱码免费| 男人舔女人下部高潮全视频| 色视频成人在线观看免| 九色视频在线播放| 国产91色在线播放| 禁断一区二区三区在线| 天天操天天爽天天射| 国产精品精品国产色婷婷| 国产精品乱码久久久| 另类天堂视频在线观看| 日韩精品中文字幕吗一区二区| 亚洲精品天堂成人片av在线播放 | 亚洲九九在线| 加勒比av中文字幕| 亚洲日本在线看| 亚洲av无码乱码国产麻豆| 欧美精品18videos性欧美| 国产精品久久久久久久久久白浆| 日韩免费视频播放| 久久九九99视频| 亚洲精品国产精品国自产网站按摩| 一区二区三区日韩在线| 日韩成人一区| 草草草视频在线观看| 成人午夜又粗又硬又大| 国产区一区二区三| 在线中文字幕日韩| 亚洲人体在线| 男人添女人荫蒂免费视频| 久久视频一区二区| 夜夜躁狠狠躁日日躁av| 欧美另类第一页| 麻豆一区一区三区四区| 无人在线观看的免费高清视频 | 亚洲国产精品网站| 午夜日韩成人影院| 在线一区亚洲| 成人免费毛片高清视频| 黄色大全在线观看| 欧美成年人视频网站欧美| 久久久久观看| 色噜噜狠狠永久免费| 亚洲无线码一区二区三区| 免费人成在线观看网站| 亚洲一区制服诱惑| 校园春色综合网| 欧美特黄一级片| 日韩电影免费观看在线观看| 亚洲色图图片| 99精品在线免费视频| 亚洲欧美一区二区在线观看| 天天躁日日躁狠狠躁喷水| 91精品国产综合久久香蕉最新版 | 在线观看毛片网站|