精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

開源丨首個AI翻譯實戰榜單出爐!GPT-4o穩坐天花板,文化方面Qwen系列一馬當先

人工智能 新聞
它由阿里國際AI Business團隊聯合上海人工智能實驗室 、北京語言大學共同發布。

AI替咱打工搞翻譯,到底誰家最好用?

終于,有人來統一翻譯江湖的標準了:首個應用型AI翻譯測評榜單TransBench在OpenCompass上線

它由阿里國際AI Business團隊聯合上海人工智能實驗室、北京語言大學共同發布。

圖片

與傳統的翻譯測評體系相比,TransBench增加了幻覺率、文化禁忌詞、敬語規范等指標,專門針對大模型翻譯最容易出錯的關鍵問題進行實戰考核。

比如:

  • 翻得挺溜但張口就編,這就得算“幻覺”;
  • 翻得準確卻冒犯了當地文化,那也是“翻譯事故”;
  • 甚至你在客服場景里少說一句“please”,都可能讓用戶不爽。

這是首次針對行業的細分領域構建評測數據和評測方法。這些指標均來自真實場景的使用反饋,由此來測評大模型是否符合大規模應用的標準。

目前,TransBench評測方法與數據集已全面開源,也已發布了首期測評結果。

歡迎各個AI翻譯機構去打榜,一較高下~

GPT-4o穩坐“翻譯AI天花板”

官網表示,TransBench數據集中涵蓋中、英、法、日、韓、西班牙等多種語言。

此外,還在不斷持續更新海量小語種。

TransBench評測體系中的數據集,根據“通用標準”“電商文化”“文化特性”三個大類,整理了不同的數據集。

圖片

目前,TransBench多語言翻譯評測榜單首期已經出爐。

評測榜單從“綜合得分”“通用標準”“電商文化”“文化特性”四個維度來給每個模型的翻譯能力打分。

其中,綜合得分是模型在評測數據集的三大維度的綜合平均得分。為了保證數值可被平均,榜單對不同得分進行了數值縮放。

我們查看并整理了“英語翻譯為其它語言”和“中文翻譯為其它語言”兩個榜單的模型能力。

英語翻譯為其他語言

這個條件下,綜合得分通用標準的得分前三,都分別是:

  • 第一:GPT-4o
  • 第二:DeepL Translate
  • 第三:GPT-4-Turbo

其中比較特別的是DeepL Translate,上個月底剛剛發布。

和前三名的另外兩位不同,這是一個專門的機器翻譯(MT,Machine Translation)模型,而不是通用大語言模型。

圖片

電商行業,DeepSeek-R1的翻譯能力殺入榜單前三:

圖片

而在文化特性方面,Qwen系列一馬當先。

Qwen2.5-0.5B-Instruct和Qwen2.5-1.5B-Instruct分別位居第一第二,同時第三名花落EuroLLM-1.7B-Instruct。

大家可能對EuroLLM-1.7B-Instruct相對陌生,它是由多個歐洲研究機構聯合開發的開源多語言大模型,涵蓋35種語言,旨在支持所有歐盟官方語言以及其他主要語言。

圖片

中文翻譯為其他語言

同樣,在中文翻譯為其他語言這條賽道上,綜合得分通用標準的排名相同:

  • 第一:GPT-4o
  • 第二:DeepSeek-V3
  • 第三:Claude-3.5-Sonnet

圖片

電商行業,拿下第一的是均值得分4.420的DeepSeek-V3。

緊隨其后的才是Gemini-2.5-Pro和Claude-3.5-Sonnet。

圖片

最后一項文化特性,Qwen系列的表現同樣出色。

榜單前三分別是Qwen2.5-0.5B-Instruct、Llama-3.3-70B-Instruct、Qwen2.5-1.5B-Instruct。

圖片

三大維度打造翻譯大模型實戰考卷

隨著AI大模型加速落地,翻譯模型也進入“比誰更好用”的時代

相應的,業內也對大模型翻譯效果有了更高的要求,比如要符合不同地區的文化特性、能體現不同行業的語言特色等。

但問題來了——怎么判斷一個AI翻譯模型到底好不好用?

傳統的翻譯測評維度,主要關注通用質量(如BLEU、COMET),難以反映真實使用場景中對語義準確性、文化合規性、用戶體驗的高要求。

并且,大模型時代的AI翻譯往往面臨幻覺等更多問題。

也就是說,傳統的翻譯測評維度在今天已經不適用了

為此,阿里國際AI Business團隊聯合上海人工智能實驗室、北京語言大學一起,構建了更全面、最新的評測標準和規范TransBench。

它從三大維度,重新定義翻譯測評:

第一,全面的通用標準

不僅包括通用質量,還新增幻覺率和魯棒性評測。

第二,行業垂直標準

這是首次針對行業的細分領域構建評測數據和評測方法,數據均來自行業細分領域真實數據,并利用語言專家在應用中的標注數據訓練面向行業的打分模型。

第三,跨文化特性標準

首次提出文化禁忌和敬語規范的評測數據和評測方法。

舉個例子!

電商場景下的用戶投訴,通常與敬語、禁忌語等相關。

這些翻譯結果從字面意思看無誤,但會直接影響到對話人的體驗,應該被納入到測評的范圍中。

從阿里國際自研翻譯大模型真實用戶反饋中總結提煉

其實,早在去年10月,阿里國際的AI Business團隊就發布了首個大規模商用的翻譯大模型Marco MT,其效果趕超Google、DeepL等頭部AI翻譯工具。

截至目前,Marco MT的日均調用量為6億次,是電商領域使用量最大的翻譯大模型。

TransBench的測評體系,正是基于Marco MT在全球真實用戶反饋中總結提煉而來

因此,構建TransBench這件事中有阿里國際的身影就很好理解了。

當然,除了有業界認可的領先技術外,業務需求也是其中原因之一。

阿里國際旗下有Aliexpress、Lazada、Alibaba.com、Trendyol及Daraz等電商業務,覆蓋全球200多個國家和地區,多語言翻譯是助力業務發展的重要一環。

根據公開信息,2023年3月,阿里國際成立了AI Business,基于全球化電商場景探索AI技術。

現在,阿里國際的所有電商平臺均已廣泛應用AI能力,已服務了超50萬賣家,形成了以服務中小企業出海為核心,覆蓋全球多元市場、多種電商模式的規模級AI應用。

目前,TransBench的測評方法進行了開源,評測結果也將持續更新。

責任編輯:張燕妮 來源: 量子位
相關推薦

2013-08-20 11:19:54

閃存IBMFlashSystem

2015-05-18 18:17:50

2015-08-19 10:49:02

2015-05-25 14:45:20

未來網絡暨SDN技術大華三

2014-02-10 14:47:53

移動設備

2025-04-07 02:33:00

GPT-4.5GPT-4oAI

2025-08-07 14:05:40

OpenAI大模型開源

2024-12-26 07:10:00

2020-04-15 09:12:48

聯想智能云桌面

2018-01-03 00:32:51

物聯網NB-IoT5G

2024-05-21 12:23:17

2024-11-28 15:51:19

GPT-4o微軟

2025-04-08 02:26:00

2025-05-26 09:05:00

2024-08-14 14:30:00

AI訓練

2025-08-05 09:15:15

2021-12-20 07:03:54

秒殺系統擴容

2025-01-02 14:03:04

2024-06-05 08:29:35

2014-04-16 14:00:23

IaaSAWS
點贊
收藏

51CTO技術棧公眾號

四虎影视国产精品| 国产在线黄色| 亚洲国产高清一区| 国产视频一区在线| 杨幂毛片午夜性生毛片 | 久久er99热精品一区二区| 色午夜这里只有精品| 能看毛片的网站| 日本不卡网站| 椎名由奈av一区二区三区| 99九九电视剧免费观看| 亚洲欧美精品一区二区三区| 国产精品久久久久无码av| 亚洲精品一区二区三区蜜桃下载| 欧美日韩大尺度| 人交獸av完整版在线观看| 91丨国产丨九色丨pron| 成人免费视频网址| 日韩色图在线观看| 欧美视频导航| 有码中文亚洲精品| 久久人人爽人人人人片| 羞羞视频在线观看一区二区| 欧美日韩国产一区二区三区| 一级全黄肉体裸体全过程| 无码精品一区二区三区在线| 免费在线观看成人| 91国内免费在线视频| 天天操夜夜操av| 杨幂一区二区三区免费看视频| 欧美电影一区二区| 免费看毛片的网址| www在线视频| 国产欧美视频一区二区| 精品久久一区二区三区蜜桃| jlzzjlzzjlzz亚洲人| 男人的天堂亚洲一区| 欧美一区二区三区图| 久久久久久久久久久网| 久久精品亚洲人成影院| 国产亚洲aⅴaaaaaa毛片| 国产精品无码在线| 9l视频自拍蝌蚪9l视频成人 | 国产精品v日韩精品v在线观看| 爱搞国产精品| 亚洲第一主播视频| 国产乱人伦精品一区二区三区| 日本在线视频网| 国产欧美日韩在线| 欧美日韩大片一区二区三区| 五月天激情开心网| 懂色av一区二区三区免费观看| 成人在线国产精品| 影音先锋黄色网址| 久久精品72免费观看| 国产精品久久久久久久久久尿| 国产区一区二区三| 国产精品人人爽人人做我的可爱| 国内成人精品一区| 日本三级午夜理伦三级三| 欧美三级特黄| 久久久久久久久久久av| 国产主播在线播放| 亚洲欧洲日本一区二区三区| 97超视频免费观看| 精品国产乱码一区二区| 亚洲久久久久| 久久人人爽人人爽爽久久 | 色狮一区二区三区四区视频| 日韩在线视频中文字幕| 久久国产高清视频| 黄色不卡一区| 久久精品99久久久久久久久| 色欲人妻综合网| 国产精品地址| 91超碰中文字幕久久精品| 中文字幕精品三级久久久| 午夜在线精品偷拍| 国产精品一区av| 国产人妻精品一区二区三区| 懂色中文一区二区在线播放| 久久艹中文字幕| 成人三级黄色免费网站| 中文字幕字幕中文在线中不卡视频| 正在播放一区| japanese色国产在线看视频| 欧美网站在线观看| 污视频网址在线观看| 欧洲一区在线| 精品亚洲va在线va天堂资源站| 国产123在线| 女生裸体视频一区二区三区| 91精品国产自产91精品| 伊人久久一区二区| 国产91色综合久久免费分享| 欧美福利精品| caoporn免费在线| 欧美视频一二三| 在线视频一二区| 日本午夜精品久久久| 中文国产亚洲喷潮| 日本熟女一区二区| 美女任你摸久久| 国产免费一区| 日本中文字幕电影在线免费观看| 五月综合激情婷婷六月色窝| 中文字幕第88页| 清纯唯美亚洲经典中文字幕| 日韩在线免费av| 久久精品国产亚洲av香蕉| 日韩精品亚洲一区二区三区免费| 666精品在线| 国产精品久久一区二区三区不卡| 亚洲九九爱视频| 国产精品天天av精麻传媒| 一区二区日韩| 日韩中文av在线| 欧美 日韩 精品| 国产成人av影院| 一区二区在线高清视频| 三上悠亚国产精品一区二区三区| 3atv一区二区三区| 91精品久久久久久久久久久久| 狠狠色狠狠色综合日日tαg| 国产精品自产拍在线观| 嫩草在线播放| 亚洲午夜成aⅴ人片| www.国产视频.com| 精品国产a一区二区三区v免费| 高清一区二区三区四区五区| 国产丝袜视频在线观看| 中文字幕欧美日韩一区| av观看免费在线| 欧美a级网站| 久久久久久久网站| 99视频免费看| 亚洲欧美日本在线| 日韩精品视频一二三| 国产欧美一区二区三区精品观看| 97超级碰碰碰久久久| 色婷婷中文字幕| 亚洲综合视频在线观看| 亚洲国产欧美91| 成人3d精品动漫精品一二三| 国产ts人妖一区二区三区| 天天干,夜夜操| 午夜电影一区二区三区| 国产精品熟妇一区二区三区四区 | 理论片在线不卡免费观看| 啪啪小视频网站| 国产欧美精品在线观看| caopor在线视频| 精品久久成人| 国产精品伦子伦免费视频| 国产精品视频二区三区| 欧美亚洲免费在线一区| 永久免费观看片现看| 另类调教123区| 亚洲精品欧洲精品| 福利视频亚洲| 久久精品国产综合| 国产黄色高清视频| 亚洲一区二区三区四区不卡| 国产精品19p| 精品成人久久| 精品国产aⅴ麻豆| 欧美男体视频| 中文字幕在线亚洲| 99re只有精品| 亚洲444eee在线观看| 成人免费看aa片| 免费观看一级特黄欧美大片| 爱爱爱视频网站| 欧州一区二区三区| 4p变态网欧美系列| yiren22亚洲综合伊人22| 777xxx欧美| 日本最新中文字幕| 国产亚洲欧美日韩在线一区| jizz大全欧美jizzcom| 午夜精品婷婷| 欧美视频观看一区| 国产不卡精品| 2019av中文字幕| 欧美一区二区三区| 精品久久久久久久久久久久久久久 | 女仆av观看一区| 国产精品白丝jk喷水视频一区| 免费黄色在线观看| 欧美精品一区二区三区视频| 国产一级免费视频| 亚洲视频每日更新| 国产国语性生话播放| 久久超碰97人人做人人爱| 久久精品视频16| 999精品在线| 国产在线精品二区| 亚洲伦理一区二区| 55夜色66夜色国产精品视频| 黄色在线论坛| 亚洲男人天堂古典| www.色视频| 在线观看视频一区| 国产在线拍揄自揄拍| 中文字幕不卡在线观看| 大尺度在线观看| 久久精品国内一区二区三区| 伊人成色综合网| 中文字幕一区二区三区欧美日韩 | 国产精品吴梦梦| av在线中出| 欧美精品一区二区免费| а天堂8中文最新版在线官网| 精品国产乱码久久久久久1区2区| 中文字幕精品一区二区精| 婷婷国产v国产偷v亚洲高清| 欧美黑人性猛交xxx| 国产精品污www在线观看| 双性尿奴穿贞c带憋尿| 国产不卡视频在线播放| 五月天av在线播放| 久久成人国产| 麻豆tv在线播放| 欧美三区视频| 老司机午夜网站| 国产二区精品| 亚洲精品久久区二区三区蜜桃臀| 日本在线中文字幕一区| 福利视频一区二区三区| 精品国产三级| 成人久久久久久久| 福利一区视频| 国产精品麻豆va在线播放| 亚洲私拍视频| 欧美最顶级的aⅴ艳星| av中文在线资源库| 欧美高清一级大片| 18av在线播放| 欧美大胆在线视频| 亚洲欧美成人影院| 欧美成人剧情片在线观看| 久久综合网导航| 日韩视频第一页| 欧美人xxx| 久久精品国产久精国产思思| 日韩欧美小视频| 日韩在线国产精品| caoporn免费在线| 欧美乱大交xxxxx另类电影| 91精品久久久| 欧美黄色片视频| heyzo高清国产精品| 久久人人97超碰精品888| 爱情岛亚洲播放路线| 国产91成人video| 一区二区三区短视频| 日韩美女中文字幕| 中文.日本.精品| 国产日韩欧美电影在线观看| 24小时成人在线视频| 3d精品h动漫啪啪一区二区| 91精品导航| 久久99精品久久久久久久青青日本 | 欧美美女一区二区在线观看| 国产尤物视频在线观看| 欧美一区二区三区男人的天堂| 国产高清第一页| 亚洲国产精品va在线看黑人| 邻居大乳一区二区三区| 在线日韩日本国产亚洲| 国产欧美久久久久久久久| 欧美激情喷水视频| 欧美天堂视频| 成人黄在线观看| 澳门久久精品| 日本亚洲自拍| 综合国产在线| 日韩中文字幕在线视频观看| 麻豆一区二区99久久久久| 日韩精品在线播放视频| 99精品1区2区| 5566中文字幕| 午夜私人影院久久久久| 天堂av免费在线观看| 欧美一区二区免费视频| 欧美一级特黄aaaaaa| 中文在线不卡视频| 性欧美videoshd高清| 情事1991在线| 日本精品视频| 日韩videos| 亚洲视频福利| 制服丝袜综合网| 成人免费va视频| 国产精品1区2区3区4区| 亚洲成人中文在线| 91无套直看片红桃| 亚洲精品久久久一区二区三区 | 熟女性饥渴一区二区三区| 美女诱惑一区二区| 日本黄色动态图| 亚洲欧美在线aaa| 国产无遮挡呻吟娇喘视频| 欧美色综合影院| 手机av免费在线观看| 日韩在线免费视频| 忘忧草在线日韩www影院| 91在线网站视频| 清纯唯美综合亚洲| 国产精品999视频| 国产风韵犹存在线视精品| 蜜桃传媒一区二区亚洲| 亚洲va在线va天堂| 99精品久久久久久中文字幕 | 国产精品二区三区四区| 欧美3p在线观看| 日韩在线xxx| eeuss国产一区二区三区| 91嫩草丨国产丨精品| 欧美亚洲国产一卡| 蝌蚪视频在线播放| 国模gogo一区二区大胆私拍| 日韩成人视屏| 久久av秘一区二区三区| 人人爽香蕉精品| 成人黄色免费网址| 一本久久精品一区二区| 亚州视频一区二区三区| 欧美极品美女视频网站在线观看免费| 欧洲亚洲精品| 亚洲国产欧洲综合997久久 | 一个色综合av| 日本精品www| 国产精品一区二区三区99| 欧美成人一二三| 亚洲va久久久噜噜噜无码久久| 亚洲网站在线播放| 深夜福利视频一区二区| 国产伦精品一区二区三区照片 | 日韩欧美中文字幕一区二区三区| 亚洲国产精品一区在线观看不卡 | 日韩av电影院| 中老年在线免费视频| 国产视频在线观看一区| 亚洲欧洲美洲一区二区三区| 久久久久久久久久一区二区| 国产精品另类一区| 91精品中文字幕| 精品国内自产拍在线观看| 色综合视频一区二区三区44| 在线视频福利一区| 精品写真视频在线观看| 天天综合天天做| 日韩欧美中文一区| 高h视频在线播放| 国产亚洲精品久久飘花| 一本久道久久综合狠狠爱| 中文在线一区二区三区| 一本久久综合亚洲鲁鲁五月天| 国产三级视频在线播放线观看| 国产精品成人一区二区| 色婷婷热久久| 国产裸体视频网站| 亚洲aⅴ怡春院| 国产香蕉在线| 成人免费直播live| 亚洲欧美一级二级三级| 91视频在线免费| 色婷婷av久久久久久久| 中文字幕在线视频区| 97久久夜色精品国产九色| 亚洲精品1区| 免费网站在线高清观看| 3d成人动漫网站| av免费不卡国产观看| 日本精品一区| 国产乱淫av一区二区三区| 日韩欧美激情视频| 一区二区成人精品| 免费精品一区| 日韩精品视频一区二区在线观看| 国产精品久久影院| 亚洲毛片欧洲毛片国产一品色| 热久久免费视频精品| 2023国产精品久久久精品双| 精品少妇人妻av一区二区三区| 色av综合在线| 秋霞在线午夜| 先锋影音亚洲资源| 成人丝袜高跟foot| 中文字幕日韩免费| 九色精品美女在线| 国产精品欧美三级在线观看| 香蕉视频色在线观看| 色综合久久九月婷婷色综合| 成人日批视频| 日本精品一区二区三区高清 久久| 国产精品99久久久久久有的能看| 日本在线播放视频| 欧美xxxx18性欧美|