精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

國產大模型推理能力已超GPT-3.5!沖進OpenAI評測榜第一梯隊

人工智能 新聞
就在9月16日,國產大模型在權威推理評測集GSM8K中,首次達到了80%正確率,大幅領先GPT-3.5(57.1%)和LLaMA2-70B(56.8%)。

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

OpenAI開源的數學數據集,中國廠商新成績一舉沖到最前列!

就在9月16日,國產大模型在權威推理評測集GSM8K中,首次達到了80%正確率,大幅領先GPT-3.5(57.1%)和LLaMA2-70B(56.8%)

而且這家廠商在大模型榜單上刷新全球紀錄,已經不是第一次了。

它背后的公司在風起云涌的大模型技術江湖中,也頻頻被提及,越來越受關注。

不賣關子,它正是天工大模型,由昆侖萬維打造。

怎么做到的?具體來看。

大模型推理能力Benchmark躋身前列

天工大模型這次一戰成名的,是大模型數學推理能力評測基準,GSM8K

GSM8K由OpenAI發布,是一個涵蓋8500個小學水平高質量數學題的數據集,設計原則有四:

高質量、高多樣性、中等難度和自然語言解決方案。

所以這家伙現在一般被用做測試各家大模型推理能力的Benchmark。

上個月,微軟和中國科學院聯合發布了一項關于WizardMath的研究結果,主要在GSM8K和另一個常見數學基準上測試了市面上主流開閉源大模型的性能。

閉源模型上,拿下最高分的是GPT-4,正確率92%;GPT-3.5的正確率為57.1%。

開源模型這邊,不同參數規模的LLaMA-2最高正確率56.8%,最高分則被微軟的WizardMath-70B拿走,正確率81.6%。

圖片

那么,天工大模型的成績怎么樣?

正確率80%。

這個成績,比目前最強數學垂域開源模型的WizardMath-70B低了1.6%,與ChatGPT、540B參數的PaLM-2幾乎持平。

并且大幅超過GPT-3.5和各個規模的LLaMA2。

同時在小米公開的中文數學測試集Cmath上,天工大模型平均準確率為76.8%(ChatGPT 74.8%)

為了做個驗證,按照慣例,天工大模型和GPT-3.5面臨了來自GSM8K測試集的英文同題考驗。

Round one

:每天,Wendi給每只雞喂三杯混合雞飼料,其中包括種子、黃粉蟲和蔬菜,以幫助它們保持健康。她分三餐給雞喂食。上午,她給雞群喂15杯飼料。下午,她再給雞喂25杯飼料。

如果Wendi有20只雞,那么一天的最后一餐,她需要給雞喂多少杯飼料?

天工大模型答,一天的最后一餐中要喂20杯飼料,才能確保雞崽子們一天都吃飽。

圖片

GPT-3.5答,Wendi需要在一天的最后一餐中給雞崽子們喂21杯飼料。

OK,這一局,GPT-3.5輸了。

Round two

問:道費爾姐妹帶著從動物收容所領養的7只小貓開車回家時,媽媽打來電話,告訴她們家里的兩只貓剛生了小貓。媽媽說,Patchy貓貓生了三倍于被領養數量的小貓,而另一只Trixie貓貓生了12只。

現在道費爾一家一共有多少只小貓?

天工大模型答,當然是有40只小貓啦~

GPT-3.5答,道費爾一家現在共有33只小貓。

看來第二局還是天工大模型贏了。

Round 3

:巨龍高坐在法爾博山上,向1000英尺范圍內的任何東西瘋狂噴火。波莉可以將壓制巨龍的武器投擲400英里,但當她拿著藍寶石時,能比不拿寶石時把標槍扔得遠三倍。

如果拿著寶石,波莉能站在龍焰射程之外多遠的地方,用金標槍擊中龍?

天工大模型給出的解題思路如下,并且生成答案為200英尺。

GPT-3.5給出的解題思路也擺在這,最后答案也是200英尺。

這次二位打成了平局。

但是可以看到,相比GPT-3.5,天工大模型的解題思路更簡單直接,解題步驟也更少更短。

一般來說,目前主流大模型們最近不太流行公開評測結果,但昆侖萬維放話了:

雖然現在還是內測階段,但天工大模型這次不僅對外公布了評測結果,還宣布后續會部署上線基座,供用戶體驗。

更重要的是,天工大模型允許研究人員、開發者申請API,對上述結果進行驗證

PS申請方法:

提供“姓名”“手機號”“所屬機構/單位”,發送至官方郵箱neice@kunlun-inc.com進行申請。

若通過,三個工作日內將收到回復郵件,內含測試API及相關信息。

(截止時間為9月27日0點)

多個榜單躋身前列

除了GSM8K,另一個推理評測基準HumanEval,以及兩個通識評測基準MMUL、C-Eval上,天工大模型也有出色表現。


根據公開測試數據搜集整理

HumanEval同樣出自OpenAI,是OpenAI為了評估Codex模型的有效性而創建的數據集。

通過這個數據集,研究人員可以對Codex模型進行評估,并了解其在代碼生成方面的準確性和效果。

在這個數據集上,天工大模型成績是37.2%。

MMLU是UC伯克利等打造,集合了科學、工程、數學、人文、社會科學等領域的57個科目。

其主要目標,是對模型的英文跨學科專業能力進行深入測試。天工大模型的成績是65%。

C-EVAL評測基準由上海交大、清華以及愛丁堡大學聯合創建,是一個面向中文語言模型的綜合考試評測集,覆蓋了52個來自不同行業領域的學科。

天工大模型的得分為65,超過了GPT-3.5的54.4的成績。

成績亮眼的天工大模型,發布在今年4月。

其AI生成能力可滿足文案創作、知識問答、代碼編程、邏輯推演、數理推算等多元化需求。

4月發布,9月能取得醬紫的成績,昆侖萬維是怎么飼養天工大模型這匹黑馬的?

先拿模型實力來說話。

這是一個雙千億大模型(指天工擁有千億預訓練基座模型和千億RLHF模型。),目前版本最高支持1萬字以上文本對話,實現20輪次以上用戶交互。

二者的“強強聯手”之下,天工大模型的優勢便凸顯了出來。

而模型層之外,為大模型積攢實力的無外乎算法、算力、數據三大件。

算法層方面,天工大模型也有自己的秘籍。

通常來說,市面上大模型們普遍采用Transformer架構。在此基礎上,天工團隊首次引入了蒙特卡洛搜索樹算法(AlphaGo背后也是這算法)

圖片

再說天工大模型背后的算力,基于中國最大的GPU集群之一

強勁算力鼎力支持的,是天文數字版的數據量——按照借助“開源力量”的策略,天工從數十萬億的數據中,最終清洗、篩選出了近3萬億單詞的數據。

現在,天工大模型在推理、通識多個榜單開花,可以想見因為背后算力、算法、數據扎實儲備,天工大模型擁有的已經不是模型規模優勢,技術創新和推理性能方面,也有了新突破。

國產大模型繞不過的狠角色

其實,推理能力大幅超過GPT-3.5和LLaMA2,已經不是昆侖萬維攜天工大模型第一次拿成績炸場。

不久之前,天工大模型多模態團隊的Skywork-MM用了大約50M的圖文數據,以遠小于其他大模型的數據量(>100M),登頂了多模態榜單。

圖片MME感知榜第一,認知榜第二,總榜第一

昆侖萬維另一則引得眾人矚目的新聞,是AI大牛顏水成的加入。

他出任天工智能聯席CEO、2050全球研究院院長,將在新加坡、倫敦、硅谷三地建立2050全球研究院的研究中心,并逐步開展幾個領域的研究:

  • 下一代Foundation Model的基礎研究和研發;
  • Agent的研發和智能體進化的研究;
  • 生物智能等前沿技術領域的探索。

圖片

顏水成道出加盟昆侖萬維的原因:

在通用人工智能領域,從研究、研發到產品是完整的鏈條,缺一不可,只有將三者完全打通,研究才能發揮最大價值。

在國內,能將研究、研發、產品三線合一的平臺少之又少,昆侖萬維布局了AI大模型、AI動漫、AI社交、AI游戲、AI搜索和AI音樂六大方向,同時昆侖萬維的核心業務面向全球市場,其能力矩陣和生態系統非常具有想象空間。

大模型潮流,浩浩蕩蕩。

今年以來國產大模型的發展勢頭迅猛,吸引越來越多的人才加入其中,由此助力各家大模型不斷地迭代升級,涌現出更強大的能力,適配更廣泛的應用場景。

昆侖萬維在大模型的變革中,戰略重視,動作頻頻,而且也有業務場景。

可以不夸張地說一句,昆侖萬維和它家的天工大模型,已經是大模型江湖中,一個繞不過去的狠角色了。

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-11-13 10:05:00

2021-07-28 15:50:47

數字化

2023-02-10 13:30:18

AI人工智能

2024-07-19 09:26:12

2015-09-25 10:20:18

華三

2024-04-19 10:39:35

2015-11-04 10:55:52

馬云batatm

2018-04-10 15:44:28

華為云服務網絡技術

2020-07-30 14:53:17

云計算

2023-07-10 15:22:29

OpenAIGPT-3.5

2023-07-22 13:09:51

模型開源

2020-09-27 12:43:35

金融科技浙大螞蟻

2017-12-19 10:51:54

IBMOracle云服務

2024-06-19 11:45:34

2023-08-06 08:06:30

OpenAIChatGPTGPT-4

2011-02-11 11:47:09

點贊
收藏

51CTO技術棧公眾號

国产综合福利在线| 盗摄牛牛av影视一区二区| 免费成人结看片| 1000部国产精品成人观看| 欧美一级高清免费| 99国产精品久久久久久久| 91色综合久久久久婷婷| 久久精品99久久久香蕉| 国产亚洲欧美在线视频| 成人午夜免费影院| 亚洲人体视频| 成人国产电影网| 深夜成人在线观看| 午夜肉伦伦影院| 午夜av免费在线观看| 欧美成人直播| 欧美三级午夜理伦三级中视频| 国产精品中出一区二区三区| 一区视频免费观看| 亚洲综合视频| 中文字幕永久在线不卡| 国产精品亚洲аv天堂网| 97人妻精品一区二区免费| bl视频在线免费观看| 欧美性色综合| 精品乱人伦小说| 97在线国产视频| 乱色精品无码一区二区国产盗| 91超碰国产精品| 精品视频一区三区九区| 青春草国产视频| 蜜桃视频在线观看免费视频网站www| 老牛影视一区二区三区| 亚洲欧美日韩一区在线| 人妻熟妇乱又伦精品视频| 色呦呦中文字幕| 亚洲欧美久久久| 亚洲人午夜精品| 欧美两根一起进3p做受视频| 国产在线观看免费| 日韩影院在线观看| 国产一区二区三区网站| www.se五月| 成人video亚洲精品| 国产成人精品一区二| 欧美激情亚洲激情| 少妇精品一区二区| 日本一区二区电影| 亚洲免费在线观看| 国产欧美综合精品一区二区| 精品免费囯产一区二区三区| 免费成人网www| 亚洲精品视频免费| 亚洲一区二区三区观看| 国产成人毛片| 亚洲国产日日夜夜| 欧洲精品久久| 一道本在线视频| 在线播放不卡| 国产一区二区三区免费视频| wwwwxxxx国产| 少妇精品久久久一区二区三区| 日韩成人av网址| 手机av在线免费| 少妇精品视频在线观看| 天天影视色香欲综合网老头| 偷拍视频一区二区| 国产成人a人亚洲精品无码| 国产亚洲精品v| 精品国产一区久久久| 精品丰满少妇一区二区三区| 欧美韩日一区| 欧美精品午夜视频| www.久久国产| 亚洲成人偷拍| 欧美日韩另类一区| 免费在线a视频| 欧美专区福利免费| 亚洲综合在线观看视频| 天堂社区 天堂综合网 天堂资源最新版| 日本a一级在线免费播放| 精品一区二区综合| 欧美亚洲日本网站| 国产黄色免费视频| 亚洲经典视频在线观看| 久久精品视频在线播放| 青青草国产在线观看| 日韩精品免费一区二区三区| 日韩成人在线免费观看| a天堂中文字幕| 秋霞影视一区二区三区| 精品久久国产字幕高潮| 一本色道综合久久欧美日韩精品| 国产中文字幕一区二区三区| 亚洲国产精品久久久| 亚洲制服在线观看| 国产原创一区| 91福利在线观看| 国产一线二线三线女| 天堂中文av在线资源库| 欧美日韩视频一区二区| 性色av蜜臀av浪潮av老女人| 深夜激情久久| 亚洲免费电影在线观看| 99久久婷婷国产综合| 国产欧美日韩综合一区在线播放| 国产精品嫩草视频| www.久久精品视频| 国产农村妇女精品一区二区| 国产精品视频资源| 无码国产精品一区二区免费16| 国产精品亲子伦对白| 视频一区二区在线| 美女91在线| 夜夜嗨av一区二区三区网页| 免费黄色特级片| 一级毛片精品毛片| 欧美不卡123| 国产精品免费无码| 欧美日韩国产传媒| 中文字幕一区二区精品| 黄色av免费播放| 欧美亚洲高清| 一本一道久久a久久精品逆3p | 99热在线精品观看| 成人免费在线视频网站| 国产精品久久久久久久免费看| 日韩国产欧美在线观看| 国产精品久久久久久免费观看| 天堂地址在线www| 亚洲欧美一区二区三区极速播放 | 97超碰人人在线| 中文字幕精品在线不卡| 在线一区高清| 黄网页免费在线观看| 亚洲黄色性网站| 欧美久久久久久久久久久久久| 亚洲一区站长工具| 欧美日韩成人综合| 精品人伦一区二区| 欧美一区=区| 美女黄毛**国产精品啪啪| av每日在线更新| 色婷婷综合久久久中文一区二区| 国产激情在线观看视频| 狼人天天伊人久久| 中文字幕在线日韩 | 国产黄色小视频在线| 欧美日韩综合一区| 国产黄色片在线| 免费成人性网站| 亚洲一区二区三区在线免费观看| 精品久久在线观看| 99国产欧美久久久精品| 亚洲欧美精品| 黑人精品视频| 在线观看免费成人| 日本wwwwwww| 网红女主播少妇精品视频| 中文字幕日韩高清| 中文字幕 人妻熟女| 国产成人综合在线观看| 91大学生片黄在线观看| 台湾佬成人网| 亚洲午夜国产成人av电影男同| 免费黄色片视频| 国产精品久久久久久久蜜臀| 亚洲综合婷婷久久| 欧美日韩大片免费观看| 欧美在线不卡区| 黄色av网址在线免费观看| 欧美三级在线视频| 99热6这里只有精品| 国产日韩精品视频一区二区三区 | 牛夜精品久久久久久久| 亚洲日本va午夜在线电影| 欧美韩国理论所午夜片917电影| 久久久蜜桃一区二区| 国产成人福利片| 亚洲欧洲一区二区| 日韩精品久久久久久久软件91| 久久久人成影片一区二区三区| 又骚又黄的视频| 亚洲欧洲制服丝袜| 在线天堂www在线国语对白| 老司机午夜精品视频在线观看| 一区二区视频国产| 成人在线视频中文字幕| 欧美精品手机在线| 外国精品视频在线观看| 亚洲综合一区二区精品导航| 免费a在线观看播放| 久久欧美肥婆一二区| 日韩最新中文字幕| gogo大尺度成人免费视频| 久久99久久亚洲国产| a在线观看免费| 欧美日韩亚洲网| 波多野结衣视频播放| 蜜臀精品一区二区三区在线观看 | 日韩精品无码一区二区三区| 99色在线观看| 色悠悠久久久久| 无码国产伦一区二区三区视频| 欧美欧美欧美欧美首页| 网站免费在线观看| 亚洲国产二区| 亚洲开发第一视频在线播放| 精品精品国产毛片在线看| 国产色视频一区| 国产伦精品一区二区三区视频金莲| 久久精品电影网| 国模精品一区二区| 亚洲国产成人久久| 国产精品久久久久精| 在线欧美日韩精品| www.国产高清| 久久精品欧美一区二区三区麻豆 | 精品众筹模特私拍视频| 亚洲第一国产精品| 国产乱叫456在线| 日本高清不卡在线观看| 日本熟妇乱子伦xxxx| 99国产精品国产精品毛片| 男插女视频网站| 久久99久久久欧美国产| 国产男女激情视频| 亚洲视频成人| 欧美不卡在线播放| 亚洲视频精品| 欧美成人综合一区| 精品三级av在线导航| 成人黄色片视频网站| 91桃色在线| 久久6精品影院| 成人片在线看| 久久亚洲影院| 亚洲乱码一区二区三区三上悠亚 | 日韩亚洲一区在线播放| 欧美极品中文字幕| 欧美日韩精品不卡| 久久久人成影片一区二区三区在哪下载 | 国产女人18毛片水真多成人如厕| 中文字幕永久有效| 日韩精品91亚洲二区在线观看| 久久久久久久激情| 美女久久网站| 亚洲午夜精品一区二区三区| 日韩欧美中文在线观看| 成人性生交大片免费看视频直播| 国产欧美自拍| 成人精品在线视频| 91麻豆精品一二三区在线| 国产日韩在线精品av| 精品一区二区三区在线观看视频| 久久青草福利网站| 免费不卡av| 97人洗澡人人免费公开视频碰碰碰| 精品久久久久一区二区三区 | 成年人视频在线观看免费| 欧美日韩国产123区| 国产精品久久久久久免费| 3atv在线一区二区三区| 800av免费在线观看| 欧美日韩一区二区三区| 国产91精品看黄网站在线观看| 在线免费观看视频一区| 91精品在线视频观看| 图片区日韩欧美亚洲| av中文在线播放| 91黄色在线观看| 国产精品高潮呻吟久久久| 日韩西西人体444www| 久久久国产免费| 欧美久久久一区| 好男人www在线视频| 亚洲美女免费精品视频在线观看| 国产69精品久久app免费版| 亚洲福利视频网站| 毛片免费在线| 欧美精品一区二区三区蜜臀 | 捆绑调教美女网站视频一区| 六月婷婷在线视频| 久久精品青草| 黄页网站在线观看视频| 日韩在线一二三区| 蜜桃视频无码区在线观看| 久久99国产精品免费网站| 伊人久久久久久久久| 久久久美女毛片| 四虎精品一区二区| 久久精品国产99国产精品| 好吊操视频这里只有精品| 久久久99精品久久| 唐朝av高清盛宴| 日本二三区不卡| 亚洲精品成av人片天堂无码 | 日本不卡高清| 国产中文字幕乱人伦在线观看| 视频一区二区欧美| 午夜视频在线免费看| 精品在线亚洲视频| 97人妻精品一区二区三区免| ...中文天堂在线一区| 少妇一级淫片免费放中国| 91麻豆精品国产91久久久更新时间| 午夜成人鲁丝片午夜精品| 欧美理论电影在线观看| 嫩草伊人久久精品少妇av杨幂| 国产视频在线观看一区| 亚洲一区二区日韩| 亚洲啊啊啊啊啊| 奇米影视在线99精品| 日韩爱爱小视频| 97久久久精品综合88久久| 538精品在线视频| 精品视频在线视频| 神马电影在线观看| 欧美激情伊人电影 | 日韩福利视频导航| 99久久免费看精品国产一区| 一区二区欧美在线观看| 一道本在线视频| 中文字幕在线日韩| 天堂久久午夜av| 日本一区二区三区四区在线观看| 最新亚洲一区| 扒开伸进免费视频| 亚洲黄一区二区三区| 国产黄色大片网站| 久久中文字幕在线| 岛国毛片av在线| 91久久精品www人人做人人爽 | 日韩国产欧美一区二区三区| 三级男人添奶爽爽爽视频| 午夜不卡在线视频| 无码一区二区三区| 亚洲精品黄网在线观看| 国产在线黄色| 国产91露脸中文字幕在线| 国产精品一区二区免费福利视频| 欧美二区三区在线| 国产精品女主播一区二区三区| 午夜视频在线观看国产| 图片区小说区区亚洲影院| 五月婷婷六月色| 欧美性受xxxx白人性爽| 色天下一区二区三区| 北条麻妃69av| 国产日韩亚洲欧美综合| 日韩欧美一级大片| 最好看的2019的中文字幕视频| 福利一区二区三区视频在线观看| 午夜欧美一区二区三区免费观看| 麻豆freexxxx性91精品| 永久免费看mv网站入口| 亚洲成av人**亚洲成av**| 懂色av一区二区三区四区| 高清欧美性猛交xxxx| 欧美三级自拍| 亚洲视频在线a| 成人免费福利片| 天天舔天天操天天干| 6080yy午夜一二三区久久| 羞羞污视频在线观看| 国产精品999| 精品淫伦v久久水蜜桃| 国产精品无码av在线播放| 久久久久久日产精品| 伊人亚洲综合网| 日韩精品在线视频观看| 亚洲精品一区| 一区二区三区精品国产| 国产a级毛片一区| 影音先锋在线国产| 久久在线免费视频| 日韩av影院| 色一情一区二区三区| 亚洲一区二区高清| 国产免费叼嘿网站免费| 中文字幕日韩精品在线| 只有精品亚洲| 国产96在线 | 亚洲| 国产精品乱人伦| 欧美一级片免费| 欧美高清视频在线观看| 窝窝社区一区二区| av中文字幕网址| 五月天欧美精品| 色视频在线免费观看| 国产精品v欧美精品v日韩| 亚洲欧美综合久久久| 精品国产av色一区二区深夜久久| 色av一区二区| 免费男女羞羞的视频网站在线观看| 欧美美乳视频网站在线观看| 国产一区二区免费视频| 来吧亚洲综合网| 亚洲精品久久久久国产| 国产精品99久久免费|