精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

阿里開源的32B大模型到底強在哪里?

人工智能
很多同學對國內大語言模型與GPT的差距也比較關心,我找到了一個Qwen1.5-72B和GPT-4的能力對比圖,如下所示,可以看到差距還是很明顯的,在數學、編程、復雜問題處理等方面都有著很大的提升空間。當然我們一直在追趕,只是別人也在進步,有人說這個差距是1年,也有人說是2年,你怎么看呢?

阿里巴巴最近開源了一個320億參數的大語言模型Qwen1.5-32B,網上都說很強很強,那么它到底強在哪里呢?

更高的性價比

Qwen1.5-32B中的B是billion的意思,也就是10億,32B就代表320億參數量。

阿里之前還開源過一個大模型Qwen-1.5-72B,72B就代表720億參數量。

相比之前開源的Qwen-1.5-72B,Qwen1.5-32B參數少了一多半,但是測試表現并沒有相差多少。

大語言模型文件中的主要內容就是參數,參數少了一半,模型的文件大小也會小一半,那么加載到顯存時占用的空間也會小一半。大家可能都知道現在顯卡比較緊俏,我特地到京東查了一下,消費級的3090在8K左右,4090已經飆升到了1.5個W左右。

圖片圖片

顯存占用小一半就可以使用更少數量的顯卡或者更低顯存的顯卡,這無疑會節省很多成本,而且模型的表現相比之前的大塊頭也沒有多少明顯的損失,所以用戶能獲得更高的性價比。

性能測試優良

上邊提到Qwen1.5-32B的性能測試表現還不錯,那么這個不錯到底表現在哪里呢?

這里我找到一張測試結果的圖表:

圖片圖片

之前我看這些圖表時都比較懵逼,主要就看誰的分數高,分高就是好,但是具體好在哪里也說不清楚。

這次我特地去查詢了這些指標代表的含義,總算是搞明白了,特別分享給大家。

這些分數對應的每一列都是一個數據集,所謂數據集就是一些問題的集合,用它們來考察大模型應對各種問題的處理能力。這些數據集通常是知名大語言模型研究機構發布的,比較權威。

  • MMLU(Massive Multitask Language Understanding): 多領域知識理解,考察的是綜合能力。涵蓋57個不同領域的多項選擇題,包括歷史、文學、科學、工程技術等多個學科。使用這個數據集能評估模型的泛化能力,就是用它解決沒有訓練過的問題,或者說新問題,看看它的表現如何。
  • CMMLU: 中文場景的多領域知識理解。由MBZUAI、上海交通大學、微軟亞洲研究院共同推出,包含67個主題,涉及自然科學、社會科學、工程、人文以及常識等,專門用于評估語言模型在中文語境下的知識和推理能力。
  • C-Eval: 中文能力評估。由上海交通大學、清華大學和愛丁堡大學的研究人員在2023年5月聯合推出。包含13948個多項選擇題,涵蓋了52個不同的學科和四個難度級別。
  • GSM8K (Google's Standard Math Dataset 8K): 解決數學問題的能力。Google開發的一個數學問題求解數據集,包含大約8,000個高中到大學水平的數學問題。
  • MATH: 解決數學問題的能力,類似于GSM8K。包含初等代數,代數,數論,計數和概率,幾何,中等代數和微積分等領域的多種數學問題,用LaTeX格式編寫。
  • MBPP (Mathematics Benchmarks for Pretrained Models): 數學推理和問題解決能力。包含一系列需要模型生成數學表達式或文字解答的數學問題。
  • HumanEval: 編程能力。由OpenAI創建,專為評估代碼生成模型的有效性。包含數百個編程題目及其解決方案。
  • BBH (Big-Bench Hard): 復雜語言理解能力。由Google、斯坦福等研究人員開發的數據集,包含大量復雜語言理解任務的集合,可能包含需要深度推理、常識運用或復雜認知技能的任務。

有了對這幾個指標的理解,我們可以看到Qwen1.5-32B和Qwen1.5-72B的能力相差無幾,在理解復雜語言的能力上還略勝一籌,不知道是不是學習了百度弱智吧的問題。

在這個對比圖表上還有幾個模型,我特別介紹下:

  • Llama2-34B:Llama是Meta公司(也就是facebook)開源的一個大預言模型,有了Llama的開源,才有了國內大模型的百花齊放,否則大家還得摸索一陣。不過從這張圖表上可以看出,Llama的這個模型已經落后了,普遍落后于其他模型,真是青出于藍而勝于藍。
  • Yi-34B:這個據稱是自研成功的開源大語言模型,也是在Llama開源后推出的,自然是借鑒了Llama,只不過不清楚借鑒了多少。這個模型是李開復老師投資的零一萬物開發出來的,也是300多億的參數,綜合能力還不錯,只是數學能力和解決復雜問題的能力比Qwen差一點。
  • Mixtral-8x7B:一款高質量的稀疏專家混合模型,是一個歐洲公司開發的。這里的混合模型說的是其內部有多個子模型,比如有的擅長數學,有的擅長法語,有的擅長代碼生成,等等。在生成Token時,Mixtral-8x7B會選擇兩個內部的專家子模型進行生成,每個專家子模型的參數是6B,所以它會比普通的300億參數處理的更快。從圖表對比可以看出其在數學和編程方面的能力還是挺不錯的。

很多同學對國內大語言模型與GPT的差距也比較關心,我找到了一個Qwen1.5-72B和GPT-4的能力對比圖,如下所示,可以看到差距還是很明顯的,在數學、編程、復雜問題處理等方面都有著很大的提升空間。當然我們一直在追趕,只是別人也在進步,有人說這個差距是1年,也有人說是2年,你怎么看呢?

圖片圖片

實測體驗

指標上的表現并不能代表全部,我們用最近熱議的“弱智吧”問題來測試一下。

“弱智吧”是一個百度貼吧,里邊充滿荒謬、離奇、不合常理的發言,研究者發現使用這里邊的問題訓練大語言模型能獲得比較好的邏輯能力。

這里使用的工具是我在AutoDL上分享的一個鏡像實例,這個鏡像基于開源項目 text-generation webui,在這個webui中可以體驗多種大語言模型。

創建實例

如果你也想實際測試一下,可以按照下面的步驟創建一個容器實例。

首先注冊一個賬號,AutoDL的訪問地址:https://www.autodl.com

創建實例時:地區選擇“西北B區”,網絡比較穩定;因為鏡像安裝的大模型需要24G顯存,所以顯卡需要選擇3090或者4090;GPU數量只需要1個就能跑起來。

圖片圖片

鏡像選擇“社區鏡像”,輸入 yinghuoai-text-generation-webui ,即可找到這個鏡像。

圖片圖片

實例啟動后,在服務器實例列表中點擊“JupyterLab”,進入一個Web頁面。

圖片圖片

在JupyterLab頁面中打開“啟動器”,這個鏡像會安裝3個大模型,默認啟動的是Qwen-32B,這實際上是一個4bit的量化模型,只需要24G的顯存就能跑起來,但是相比原版的32B性能略有下降,不過也夠用了。原版的32B需要數倍的顯存,AutoDL上跑起來成本太高。

圖片圖片

啟動成功后,我們可以看到一個Gradio的鏈接,點擊就會在瀏覽器打開 text-generation-webui。

圖片圖片

另外 text-generation-webui 還支持通過API訪問大模型,API定義兼容OpenAI協議,有興趣的可以體驗下。

體驗Qwen-32B

進入后需要先設置一下角色,在參數(Parameters)頁簽中,選擇“AI助理”。這個AI助理是我創建的,方便進行中文對話。

圖片圖片

在聊天(Chat)頁簽的右側,有一個“Mode”,定義了大模型處理提示詞的模式,需要選擇“chat-instruct”。

圖片圖片

然后我們就可以和它聊天了,如下是弱智吧的3個經典問題。可以看到,只有“生魚片是死魚片”這個問題回答的不太好,大模型好像不太能理解生魚片的生到底是什么意思。

圖片圖片

正常應該怎么回答呢?我先到阿里的“通義千問”上問了一下,感覺也沒太能回答到點上,畢竟師出同門,訓練用的語料應該都差不多。

圖片圖片

然后我又找了一個GPT-4的應用問了一下。GPT-4倒是準確把握住了“生”和“死”的含義,只是它回答的不是那么直接,大家看圖片中的內容吧。

圖片圖片

在測試數據集的評測中,Qwen1.5-32B的中文處理能力是明顯高于GPT-4的,但是“生魚片是死魚片”這個問題的確沒有回答好,這是模型的泛化能力不足,還是訓練語料的問題呢?對于這個問題,你怎么看?

模型下載

Huggingface:

https://huggingface.co/Qwen

Huggingface鏡像站:

https://hf-mirror.com/Qwen

AI快站:

https://aifasthub.com/models/Qwen

責任編輯:武曉燕 來源: 螢火架構
相關推薦

2024-04-08 08:05:00

大模型人工智能開源

2025-03-25 09:24:05

2025-09-19 11:09:40

2023-11-03 07:47:12

機器資源大模型:

2025-06-18 02:30:00

推理能力強化學習大語言模型

2025-03-25 12:11:08

2024-09-20 10:02:12

2021-12-15 06:58:28

RedisEhCache緩存

2021-10-06 19:02:36

Keil編譯器Armclang

2017-06-22 16:18:58

IBM光譜存儲軟件定義存儲

2023-09-05 14:43:15

2021-02-26 07:17:47

MySQLMariaDB

2025-10-29 00:00:00

光通信AI人工智能

2025-04-14 09:27:00

2021-07-26 08:12:31

開源API網關

2025-06-12 08:46:00

2014-01-07 13:54:40

Hadoop日志

2019-05-22 10:38:00

5G芯片中興
點贊
收藏

51CTO技術棧公眾號

特级做a爱片免费69| 免费欧美一级片| 日本在线天堂| 国产精品资源在线| 777午夜精品福利在线观看| 手机免费看av| 88久久精品| 欧美专区日韩专区| 妞干网在线播放| 国产高清视频在线| 成人性生交大合| 国产精品丝袜久久久久久高清| 久久久久成人精品无码| 精品精品久久| 亚洲国产高清高潮精品美女| www.国产区| 视频一区二区三区不卡 | 午夜剧场在线免费观看| f2c人成在线观看免费视频| 国产精品美女久久福利网站| 精品蜜桃一区二区三区| 国产强伦人妻毛片| 日韩不卡免费视频| 88xx成人精品| 国产精品不卡av| 亚洲欧洲中文字幕| 在线观看久久久久久| 中国特级黄色大片| 精品国产亚洲一区二区三区大结局 | 亚洲福利小视频| 永久免费黄色片| 国产精品高潮久久| 色欧美88888久久久久久影院| 亚洲理论电影在线观看| jizz性欧美| 18成人在线观看| 午夜精品一区二区三区四区| 色播色播色播色播色播在线| 成人国产免费视频| 官网99热精品| 亚洲欧美强伦一区二区| 国产乱理伦片在线观看夜一区| 国产精品视频男人的天堂| www.国产一区二区| 先锋亚洲精品| 欧洲美女7788成人免费视频| 国产成人无码一区二区三区在线| 欧美日韩亚洲一区| 欧美激情在线观看| 欧美成人精品欧美一级| 在线精品视频在线观看高清| 久久久久www| 希岛爱理中文字幕| 91精品久久久久久久久久不卡| 日韩视频第一页| 中文乱码字幕高清一区二区| 久久国产亚洲精品| 日韩视频免费看| 欧美做爰爽爽爽爽爽爽| 在线成人超碰| 久久久亚洲国产| 你懂的国产视频| 久久成人在线| 国产精品热视频| 国产乱人乱偷精品视频a人人澡| 久久精品国产成人一区二区三区| 国产一区二区丝袜| 国产ts变态重口人妖hd| 成人精品免费看| 久久久久高清| 91网页在线观看| 亚洲人xxxx| www精品久久| 国产免费不卡| 欧美日韩免费在线视频| 夜夜爽久久精品91| 精品亚洲自拍| 在线成人激情视频| 国产一区二区三区在线视频观看| 雨宫琴音一区二区在线| 国产91在线播放| 一级特黄aaaaaa大片| 国产成人综合网站| 久久国产一区二区| 午夜伦理在线| 亚洲一区二区黄色| 不要播放器的av网站| 高清不卡一区| 免费观看亚洲天堂| 在线视频中文字幕一区二区| 九九热99视频| 国产成人一二| 中文字幕九色91在线| 国产va在线播放| 蘑菇福利视频一区播放| 91色在线观看| 日韩国产福利| 亚洲精品视频在线| 熟女人妇 成熟妇女系列视频| 老司机亚洲精品一区二区| 国产丝袜一区二区三区| 成人在线观看免费完整| 亚洲男人影院| 超碰97在线资源| 亚乱亚乱亚洲乱妇| 欧美日韩免费观看中文| 国内精品国产三级国产aⅴ久| 蜜乳av综合| 欧美激情喷水视频| 91精品人妻一区二区三区果冻| 久久久国产精品成人免费| 天天射成人网| 欧美一区二三区| 青青草91视频| 欧美成年人视频| 亚洲成人第一网站| 成人一级黄色片| 亚洲精品永久www嫩草| 日韩毛片视频| 蜜臀久久99精品久久久无需会员 | 一区二区三区网站| 国产精品mp4| 午夜福利一区二区三区| 亚洲久草在线视频| 欧美美女性视频| 国产一区日韩| 啪一啪鲁一鲁2019在线视频| 成人乱码一区二区三区| 亚洲色图视频网| 伊人影院综合在线| 成人精品天堂一区二区三区| 欧美有码在线观看视频| 秋霞av鲁丝片一区二区| 亚洲精品乱码久久久久| 国产成年人视频网站| 精品国产91| 国产福利视频一区二区| 天天操天天操天天操| 亚洲午夜私人影院| avtt中文字幕| 欧美涩涩视频| 国产精品一级久久久| 色女人在线视频| 欧美一级日韩不卡播放免费| 黄色裸体一级片| 免费高清在线一区| 一本色道久久综合亚洲精品婷婷| 国产69精品久久久久9999人| 在线观看欧美日韩国产| 波多野结衣视频免费观看| 久久久精品免费免费| 欧美激情国产精品日韩| 久久最新网址| 国产精品美女久久久免费| 9191在线| 欧美一区二区三区爱爱| 久草中文在线视频| 成人av在线资源网| 哪个网站能看毛片| 精品一区二区三| 国产美女久久精品| 69成人在线| 精品粉嫩超白一线天av| 久久国产精品系列| 国产亚洲女人久久久久毛片| 亚洲欧洲日本精品| 午夜久久福利| 噜噜噜噜噜久久久久久91| 精品无人乱码一区二区三区| 日韩中文字在线| 亚洲精品久久久久久无码色欲四季 | 亚洲特色特黄| 粉嫩精品一区二区三区在线观看| 丁香花电影在线观看完整版| 亚洲国产小视频在线观看| 麻豆成人免费视频| 国产精品国产自产拍高清av王其 | 久久国产精品视频在线观看| 九九综合久久| 91久久精品美女| 99re6在线精品视频免费播放| 亚洲人成网7777777国产| 在线观看国产小视频| 亚洲综合激情另类小说区| 可以直接看的无码av| 久久99九九99精品| 全黄性性激高免费视频| 日韩电影免费网站| 国产精品毛片一区视频| av一区在线播放| 久久69精品久久久久久国产越南| av女名字大全列表| 欧美精品久久久久久久多人混战 | 免费一区二区| 中文字幕一区二区三中文字幕| 奇米影视四色在线| 一区二区亚洲精品| 亚洲精品一区二区三区av| 中文字幕一区二区三区日韩精品 | 图片区小说区区亚洲五月| 视频在线一区| 国产精品av网站| 日韩av官网| 色偷偷av一区二区三区| 色一情一乱一区二区三区| 欧美日韩一区二区三区不卡| 国产成人在线播放视频| 1024成人网| 精品欧美一区二区久久久| 大桥未久av一区二区三区中文| 性猛交ⅹ×××乱大交| 久久成人免费| 日韩欧美一区二| 欧美日韩伊人| 亚洲最新免费视频| 成人一二三区| 欧日韩一区二区三区| 第一区第二区在线| 91日本在线视频| 国产精品毛片久久久久久久久久99999999 | 国产毛片毛片毛片毛片毛片毛片| 国内久久精品视频| 波多结衣在线观看| 米奇777在线欧美播放| 免费一级特黄毛片| 黄色成人精品网站| 青春草在线视频免费观看| 成人免费a**址| 奇米888一区二区三区| 青青一区二区| 狠狠色噜噜狠狠狠狠色吗综合| 欧美影院在线| 99久久精品无码一区二区毛片| 国产成人精品一区二区三区免费| 欧美一区二区.| 国产一二在线播放| 91精品国产九九九久久久亚洲| 毛片网站在线看| 欧美裸体男粗大视频在线观看| 成人在线app| 久久天堂电影网| dy888亚洲精品一区二区三区| 久久午夜a级毛片| 岛国成人毛片| 欧美精品在线免费| 日本动漫理论片在线观看网站| 久久国产精品影视| 羞羞的视频在线观看| 欧美老肥婆性猛交视频| 性直播体位视频在线观看| 欧美日韩第一页| 国产99re66在线视频| 午夜精品www| 2022成人影院| 国产精品久久久精品| 欧美成人福利| 亚洲一区国产精品| 综合欧美亚洲| 精品视频一区二区三区四区| 欧美**字幕| 色就是色欧美| 亚洲天堂免费| 日韩欧美一区三区| 日韩高清国产一区在线| 色综合色综合色综合色综合| 黄网站免费久久| 国产精九九网站漫画| 久久在线免费观看| 欧美一区二区三区观看| 亚洲女人小视频在线观看| 国产亚洲精品码| 精品久久久久久久久久久久久久| 波多野结衣av无码| 欧美一区二区三区色| 欧美在线精品一区二区三区| 亚洲美女福利视频网站| 日本欧美在线视频免费观看| 老司机一区二区| 黄在线观看网站| 美女网站在线免费欧美精品| 成人三级做爰av| 久久午夜老司机| 91麻豆精品成人一区二区| 亚洲电影第三页| 中文字幕av片| 精品久久久久久久久久久久久久久 | 亚洲国产欧美日韩在线| 91一区一区三区| 69夜色精品国产69乱| 五月婷婷激情综合网| 国产视频1区2区| 日韩欧美国产成人一区二区| 青青草手机在线| 久久国产精品久久久久久| 欧美1级2级| 国产精品三区在线| 欧美三级伦理在线| 人人妻人人添人人爽欧美一区| 精品综合免费视频观看| 日韩av一二区| 亚洲精品视频免费看| 波多野结衣毛片| 亚洲精品美女视频| 亚洲区欧洲区| 国产欧美在线观看| 蜜臀91精品国产高清在线观看| 亚洲av首页在线| 美女一区二区视频| 免费在线观看你懂的| 一区二区不卡在线播放| 伊人网av在线| 亚洲系列中文字幕| 99爱在线视频| 粉嫩av免费一区二区三区| 欧美丰满日韩| 一区二区三区免费播放| 99r国产精品| 日本一级黄色录像| 欧美成人激情免费网| 欧美性videos| 国产精品夜色7777狼人| 国产不卡一区| 亚洲国产精品久久久久婷蜜芽| 成人午夜大片免费观看| 日韩a级片在线观看| 欧美区一区二区三区| 91在线看黄| 国产精品永久免费观看| 精品视频国产| 午夜欧美福利视频| 国产欧美精品国产国产专区 | 日本一区二区三区视频在线观看| 亚洲深夜激情| 少妇户外露出[11p]| 亚洲超丰满肉感bbw| 欧美自拍偷拍第一页| 欧美片一区二区三区| 日本一区二区乱| 可以在线看黄的网站| 国产精品香蕉一区二区三区| 久久国产波多野结衣| 日韩一区二区电影在线| a级片国产精品自在拍在线播放| 国产一区二中文字幕在线看| 日韩片欧美片| 午夜视频在线网站| 亚洲免费在线视频一区 二区| 国产精品自拍电影| 欧美裸身视频免费观看| 黄色成人美女网站| 国产丝袜美腿一区二区三区| 激情五月深爱五月| 欧美性猛交xxxxxx富婆| 高清在线观看av| 国产精品无码专区在线观看| 久久国产成人精品| 天天综合成人网| 亚洲精品日日夜夜| 亚洲精品中文字幕成人片| 久久久久日韩精品久久久男男 | 在线不卡亚洲| 国产美女视频免费观看下载软件| 午夜精品福利一区二区蜜股av| 污污视频在线观看网站| 日韩美女主播视频| 手机在线电影一区| 少妇愉情理伦片bd| 偷拍亚洲欧洲综合| 国产精品一区二区三区四区色 | aiss精品大尺度系列| 久久精品国产清高在天天线| 青青精品视频播放| 亚洲精品国产setv| 老司机午夜av| 1024亚洲合集| 黄色片一区二区三区| 欧美一级片一区| 欧美hd在线| 白嫩情侣偷拍呻吟刺激| 色欧美日韩亚洲| h视频在线免费观看| 精品在线不卡| 麻豆精品久久久| 国产一级片久久| 在线a欧美视频| 国产精品x8x8一区二区| 91香蕉视频污版| 一区二区三区不卡在线观看| 黄色在线视频观看网站| 99精品国产高清在线观看| 三级精品在线观看| 欧美成人综合色| 一道本无吗dⅴd在线播放一区| 日韩欧美中文字幕在线视频 | 嗯啊主人调教在线播放视频| 午夜精品一区二区在线观看| 成人免费看的视频| 国产一区二区三区黄片| 欧美在线视频一区二区| 你懂的网址国产 欧美|