精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

通義千問再開源,Qwen1.5帶來六種體量模型,性能超越GPT3.5

人工智能 新聞
超越 Claude、GPT-3.5,提升了多語言支持能力。

趕在春節(jié)前,通義千問大模型(Qwen)的 1.5 版上線了。今天上午,新版本的消息引發(fā)了 AI 社區(qū)關注。

新版大模型包括六個型號尺寸:0.5B、1.8B、4B、7B、14B 和 72B,其中最強版本的性能超越了 GPT 3.5、Mistral-Medium,包括 Base 模型和 Chat 模型,且有多語言支持。

阿里通義千問團隊表示,相關技術也已經(jīng)上線到了通義千問官網(wǎng)和通義千問 App。

除此以外,今天 Qwen 1.5 的發(fā)布還有如下一些重點:

  • 支持 32K 上下文長度;
  • 開放了 Base + Chat 模型的 checkpoint;
  • 可與 Transformers 一起本地運行;
  • 同時發(fā)布了 GPTQ Int-4 / Int8、AWQ 和 GGUF 權重。

借助更先進的大模型作為評委,通義千問團隊在兩個廣泛使用的基準 MT-Bench 和 Alpaca-Eval 上對 Qwen1.5 進行了初步評估,評估結果如下:

圖片

盡管落后于 GPT-4-Turbo,但最大版本的 Qwen1.5 模型 Qwen1.5-72B-Chat 在 MT-Bench 和 Alpaca-Eval v2 上都表現(xiàn)出了可觀的效果,性能超過 Claude-2.1、GPT-3.5-Turbo-0613、Mixtral-8x7b-instruct 和 TULU 2 DPO 70B,與最近熱門的新模型 Mistral Medium 不相上下。

此外通義千問團隊表示,雖然大模型判斷的評分似乎與回答的長度有關,但人類觀察結果表明 Qwen1.5 并沒有因為產(chǎn)生過長的回答來影響評分。AlpacaEval 2.0 上 Qwen1.5-Chat 的平均長度為 1618,與 GPT-4 的長度一致,比 GPT-4-Turbo 短。

通義千問的開發(fā)者表示,最近幾個月,他們一直在專注探索如何構建一個真正「卓越」的模型,并在此過程中不斷提升開發(fā)者的使用體驗。

圖片

相較于以往版本,本次更新著重提升了 Chat 模型與人類偏好的對齊程度,并且顯著增強了模型的多語言處理能力。在序列長度方面,所有規(guī)模模型均已實現(xiàn) 32768 個 tokens 的上下文長度范圍支持。同時,預訓練 Base 模型的質量也有關鍵優(yōu)化,有望在微調過程中為人們帶來更佳體驗。

基礎能力

關于模型基礎能力的評測,通義千問團隊在 MMLU(5-shot)、C-Eval、Humaneval、GS8K、BBH 等基準數(shù)據(jù)集上對 Qwen1.5 進行了評估。

圖片

在不同模型尺寸下,Qwen1.5 都在評估基準中表現(xiàn)出強大的性能,72B 的版本在所有基準測試中都超越了 Llama2-70B,展示了其在語言理解、推理和數(shù)學方面的能力。

最近一段時間,小型模型的構建是業(yè)內(nèi)熱點之一,通義千問團隊將模型參數(shù)小于 70 億的 Qwen1.5 模型與社區(qū)中重要的小型模型進行了比較:

圖片

在參數(shù)規(guī)模低于 70 億的范圍內(nèi) Qwen1.5 與業(yè)界領先的小型模型相比具有很強的競爭力。

多語言能力

在來自歐洲、東亞和東南亞的 12 種不同語言上,通義千問團隊評估了 Base 模型的多語言能力。從開源社區(qū)的公開數(shù)據(jù)集中,阿里研究者構建了如下表所示的評測集合,共涵蓋四個不同的維度:考試、理解、翻譯、數(shù)學。下表提供了每個測試集的詳細信息,包括其評測配置、評價指標以及所涉及的具體語言種類。

圖片

詳細的結果如下:

圖片

上述結果表明,Qwen1.5 Base 模型在 12 種不同語言的多語言能力方面表現(xiàn)出色,在學科知識、語言理解、翻譯、數(shù)學等各個維度的評估中,均展現(xiàn)了不錯的結果。更進一步地,在 Chat 模型的多語言能力上,可以觀察到如下結果:

圖片

長序列

隨著長序列理解的需求不斷增加,阿里在新版本上提升了千問模型的相應能力,全系列 Qwen1.5 模型支持 32K tokens 的上下文。通義千問團隊在 L-Eval 基準上評估了 Qwen1.5 模型的性能,該基準衡量了模型根據(jù)長上下文生成響應的能力。結果如下:

圖片

從結果來看,即使像 Qwen1.5-7B-Chat 這樣的小規(guī)模模型,也能表現(xiàn)出與 GPT-3.5 可比較的性能,而最大的模型 Qwen1.5-72B-Chat 僅略微落后于 GPT4-32k。

值得一提的是,以上結果僅展示了 Qwen 1.5 在 32K tokens 長度下的效果,并不代表模型最大只能支持 32K 長度。開發(fā)者可以在 config.json 中,將 max_position_embedding 嘗試修改為更大的值,觀察模型在更長上下文理解場景下,是否可以實現(xiàn)令人滿意的效果。

鏈接外部系統(tǒng)

如今,通用語言模型的一大魅力在于其與外部系統(tǒng)對接的潛在能力。RAG 作為一種在社區(qū)中快速興起的任務,有效應對了大語言模型面臨的一些典型挑戰(zhàn),如幻覺、無法獲取實時更新或私有數(shù)據(jù)等問題。此外,語言模型在使用 API 和根據(jù)指令及示例編寫代碼方面,展現(xiàn)出了強大的能力。大模型能夠使用代碼解釋器或扮演 AI 智能體,發(fā)揮出更為廣闊的價值。

通義千問團隊對 Qwen1.5 系列 Chat 模型在 RAG 任務上的端到端效果進行了評估。評測基于 RGB 測試集,是一個用于中英文 RAG 評估的集合:

圖片

圖片

然后,通義千問團隊在 T-Eval 基準測試中評估了 Qwen1.5 作為通用智能體運行的能力。所有 Qwen1.5 模型都沒有專門面向基準進行優(yōu)化:

圖片

圖片

為了測試工具調用能力,阿里使用自身開源的評估基準測試模型正確選擇、調用工具的能力,結果如下:

圖片

最后,由于 Python 代碼解釋器已成為高級 LLM 越來越強大的工具,通義千問團隊還在之前開源的評估基準上評估了新模型利用這一工具的能力:

圖片

結果表明,較大的 Qwen1.5-Chat 模型通常優(yōu)于較小的模型,其中 Qwen1.5-72B-Chat 接近 GPT-4 的工具使用性能。不過,在數(shù)學解題和可視化等代碼解釋器任務中,即使是最大的 Qwen1.5-72B-Chat 模型也會因編碼能力而明顯落后于 GPT-4。阿里表示,會在未來的版本中,在預訓練和對齊過程中提高所有 Qwen 模型的編碼能力。

Qwen1.5 與 HuggingFace transformers 代碼庫進行了集成。從 4.37.0 版本開始,開發(fā)者可以直接使用 transformers 庫原生代碼,而不加載任何自定義代碼(指定 trust_remote_code 選項)來使用 Qwen1.5。

在開源生態(tài)上,阿里已經(jīng)與 vLLM、SGLang(用于部署)、AutoAWQ、AutoGPTQ(用于量化)、Axolotl、LLaMA-Factory(用于微調)以及 llama.cpp(用于本地 LLM 推理)等框架合作,所有這些框架現(xiàn)在都支持 Qwen1.5。Qwen1.5 系列目前也可以在 Ollama 和 LMStudio 等平臺上使用。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-06-11 09:20:48

2023-11-01 19:03:58

GPT-4

2023-10-31 15:26:02

阿里云通義千問

2024-08-30 15:19:22

2023-09-01 21:12:13

GPT3.5模型微調

2023-02-16 13:48:56

模型論文

2023-08-23 13:27:00

SQLCoder開源開發(fā)

2024-06-11 07:03:00

大模型開源Qwen2

2025-02-08 09:30:00

2023-12-01 13:36:01

阿里云通義千問

2025-09-12 10:02:21

AI模型開源

2023-12-12 13:16:00

模型訓練

2025-09-15 03:00:00

2023-08-03 19:11:45

2025-08-15 12:53:15

2024-10-30 11:06:59

SpringAI模型

2025-03-27 10:04:36

阿里云通義千問多模態(tài)

2023-12-27 14:06:00

模型訓練

2025-05-15 03:25:00

點贊
收藏

51CTO技術棧公眾號

女人扒开屁股爽桶30分钟| 精品无码久久久久久久动漫| 尤物在线免费视频| av综合网页| 日本道精品一区二区三区| 中文字幕一区二区三区最新| 三级视频在线看| 日本怡春院一区二区| 欧美日韩国产成人高清视频| 日本japanese极品少妇| 四虎国产精品永久在线国在线| 亚洲精品乱码久久久久久| 鲁丝一区二区三区免费| www.日韩高清| 日本欧美加勒比视频| 欧美激情在线观看视频| 日本高清黄色片| 久久成人福利| 日韩欧美中文字幕制服| 99免费视频观看| 欧美性猛片xxxxx免费中国 | 欧美大波大乳巨大乳| 亚洲一区网址| 欧美人动与zoxxxx乱| 免费在线a视频| 欧美人与牲禽动交com| 国产精品剧情在线亚洲| 精品日本一区二区三区在线观看| 国产精品国产三级国产aⅴ| 亚洲一区观看| 97色在线视频| 国产精品老熟女一区二区| 成人精品视频| 亚洲性无码av在线| 极品白嫩丰满美女无套| av综合网页| 精品久久久久久无| 免费人成视频在线播放| 国产一区二区视频在线看| 欧美性色黄大片手机版| 超碰影院在线观看| 成人美女黄网站| 欧美小视频在线| 欧美精品一区免费| av剧情在线观看| 亚洲成人www| 久久99久久久久久| 丁香花电影在线观看完整版| 亚洲综合色区另类av| 免费的一级黄色片| 欧美videossex| 亚洲一区成人在线| www.日本在线播放| 女厕盗摄一区二区三区| 欧美日韩中文字幕在线| 无码精品a∨在线观看中文| 欧美gv在线| 日韩欧美中文在线| 别急慢慢来1978如如2| 韩国精品主播一区二区在线观看| 日本高清不卡视频| 日韩一区二区三区不卡视频| 日本成人一区二区| 欧美一区二区视频网站| 岛国大片在线免费观看| 亚洲精品一区国产| 亚洲经典中文字幕| 成人乱码一区二区三区av| 国产探花一区| 久久精品视频亚洲| 妺妺窝人体色www婷婷| 亚洲视频久久| 秋霞av国产精品一区| 国产九色91回来了| 国精品**一区二区三区在线蜜桃 | 欧美牲交a欧美牲交aⅴ免费真| 华人av在线| 在线观看日韩高清av| 中国黄色片免费看| 51精品国产| 亚洲色图av在线| 国产老头老太做爰视频| 999亚洲国产精| 国产精品九九九| 国产探花精品一区二区| youjizz国产精品| 日韩欧美亚洲在线| 羞羞视频在线观看免费| 日韩欧美亚洲国产一区| 日韩成人av免费| 老牛影视av一区二区在线观看| 国产午夜精品美女视频明星a级| 免费一级suv好看的国产网站| 欧美日韩国产探花| 国产精品va在线播放| 国产原创中文av| 99精品视频在线免费观看| 亚洲春色在线视频| 51精品视频| 欧美日本韩国一区| 国产中文字幕一区二区| 婷婷综合伊人| 国产成人精品日本亚洲专区61| 99久久精品国产一区色| 久久久精品中文字幕麻豆发布| 欧洲精品视频在线| 在线成人视屏| 亚洲激情视频在线| 青娱乐免费在线视频| 日韩**一区毛片| 精品一区二区不卡| 在线三级电影| 欧美日韩精品免费观看视频| www.超碰97| 欧美日韩影院| 成人信息集中地欧美| 邻居大乳一区二区三区| 亚洲高清在线视频| 日韩久久久久久久久久久| 日韩精品免费一区二区在线观看 | 亚洲人成自拍网站| 亚洲一区二区91| 国内精品在线播放| 亚洲一区二区三区精品在线观看| 91久久精品国产91性色69| 国语一区二区三区| www.99久久热国产日韩欧美.com| 国产成人在线免费视频| 国产福利一区二区三区视频在线| 天堂av一区二区| 黄色亚洲网站| 亚洲黄色有码视频| 国产一级一片免费播放放a| 九一九一国产精品| 亚洲mv在线看| 成人做爰免费视频免费看| 精品亚洲夜色av98在线观看| 日韩精品――中文字幕| 成人在线视频一区二区| 日本福利视频网站| youjizz亚洲| 久久在线精品视频| 国产精品毛片一区二区在线看舒淇 | 日本人dh亚洲人ⅹxx| 91精品国产成人观看| 国产欧美一区二区三区四区| 最新电影电视剧在线观看免费观看| 色偷偷久久一区二区三区| 草草影院第一页| 久久精品系列| 日本一区二区不卡高清更新| 色婷婷综合久久久中字幕精品久久 | 久久性感美女视频| 国产日韩精品在线| 国产激情在线观看| 日韩美女主播在线视频一区二区三区 | 国产精品视频无码| 亚洲黄色性网站| 国产ts在线观看| 亚洲黄色成人| 麻豆成人小视频| 69堂免费精品视频在线播放| 中文字幕国产亚洲2019| 97caocao| 亚洲国产一区二区三区| avtt香蕉久久| 日本中文字幕不卡| 免费成人进口网站| 国产精品22p| 国产成人精品久久二区二区| 免费在线看黄网站| 欧美tk—视频vk| 久久久久久久久久久影院| 国产日韩精品一区二区三区在线| 欧美婷婷精品激情| 韩日精品在线| 日本不卡免费新一二三区| 国产激情综合| 91精品国产高清自在线| 在线免费看a| 精品国产1区二区| 最近中文字幕在线观看视频| 亚洲美腿欧美偷拍| 91精品国产自产| 激情图区综合网| 熟女少妇在线视频播放| 久久电影院7| 国新精品乱码一区二区三区18| 欧美亚洲韩国| 欧美激情区在线播放| wwwww在线观看免费视频| 日韩女同互慰一区二区| 成人免费视频国产免费| 一区二区国产视频| 女人黄色一级片| 成人妖精视频yjsp地址| 日本人视频jizz页码69| 亚洲激情一区| 青春草在线视频免费观看| 亚洲欧美校园春色| 97超碰资源| 男女啪啪999亚洲精品| 97碰碰碰免费色视频| 久做在线视频免费观看| 亚洲免费伊人电影在线观看av| 国产欧美熟妇另类久久久| 日韩欧美在线视频| 国产极品在线播放| 亚洲三级在线免费观看| 欧美性猛交xxxx乱| 99久久精品国产导航| 69久久精品无码一区二区 | 国产成人精品综合| 欧美hdxxxx| 久久国内精品一国内精品| 免费播放片a高清在线观看| 精品福利av导航| 99产精品成人啪免费网站| 欧美性生活大片视频| 香蕉影院在线观看| 午夜精品久久久久久久99樱桃| 精品国产视频在线观看| 国产精品免费视频一区| 九一在线免费观看| 久久久精品黄色| 白丝女仆被免费网站| 99久久精品一区| 91精品啪在线观看国产| 国产99久久久精品| 色哟哟免费视频| 国内一区二区在线| 做a视频在线观看| 蓝色福利精品导航| 高清av免费看| 美女视频黄久久| 特级丰满少妇一级| 免费成人你懂的| 五月婷婷六月合| 免费高清在线视频一区·| 蜜臀视频一区二区三区| 久久精选视频| 亚洲精品高清无码视频| 丝袜诱惑制服诱惑色一区在线观看 | 欧美日韩电影免费看| 日本久久精品视频| 78精品国产综合久久香蕉| 国产精品久久久久久久久男| 日本精品网站| 国产日韩中文在线| 99久久999| 岛国视频一区免费观看| 北条麻妃在线一区二区免费播放| 国产精品国色综合久久| 国产精品天天看天天狠| 精品乱码一区| 国产精品密蕾丝视频下载| 先锋影音一区二区三区| 成人亚洲一区| 男女激烈动态图| 亚洲电影成人| 欧美污视频网站| 六月丁香婷婷久久| 无码人妻少妇色欲av一区二区| 东方欧美亚洲色图在线| 99re久久精品国产| 国产欧美综合在线| 深夜福利影院在线观看| 亚洲电影一区二区| 中文字幕在线日本| 在线电影一区二区三区| 亚洲第一色视频| 日韩电视剧免费观看网站| 高清美女视频一区| 不卡av电影院| 牛牛精品一区二区| 成人国产精品久久久久久亚洲| 国产精品麻豆| 另类欧美小说| 久久久久久久久久久久久久| 国产3p露脸普通话对白| 美女国产一区二区| 国产免费无码一区二区| 久久精品夜色噜噜亚洲a∨| 中文国语毛片高清视频| 亚洲成a人v欧美综合天堂下载| 中文字幕在线观看视频免费| 欧美一区二区视频免费观看| 三级在线视频| 裸体女人亚洲精品一区| 一呦二呦三呦精品国产| 444亚洲人体| 精品国产一区二区三区香蕉沈先生| 日韩第一页在线观看| 性欧美videos另类喷潮| 日本亚洲一区二区三区| 久久久久高清精品| 亚洲国产精品成人无久久精品| 91国产成人在线| 免费观看黄一级视频| 日日摸夜夜添一区| 午夜影院在线观看国产主播| 91日韩在线视频| 精品久久中文| 久久久久久人妻一区二区三区| 精品一区二区在线播放| 爱爱免费小视频| 亚洲高清三级视频| 91影院在线播放| 国产亚洲欧洲高清一区| 蜜桃麻豆影像在线观看| 成人av免费看| 欧美国产一区二区三区激情无套| 人妻有码中文字幕| 国产不卡在线视频| 国产一二三区精品| 欧美性感一区二区三区| 神马久久高清| 国产综合在线视频| 日韩视频一区二区三区四区| 一区在线电影| 免费久久99精品国产| 国产又粗又猛又爽视频| 精品日本高清在线播放| 蜜桃在线一区二区| 欧美激情网友自拍| 欧美高清一级片| 五月天综合婷婷| 麻豆91精品视频| 日本免费www| 欧洲av在线精品| 国产在线网站| 国产91在线高潮白浆在线观看| 国产香蕉精品| 黄色一级片在线看| 成人国产视频在线观看| 麻豆疯狂做受xxxx高潮视频| 日韩一区二区三区视频| 国产精品刘玥久久一区| 91免费高清视频| 我不卡手机影院| 天天综合成人网| 亚洲人成精品久久久久| 国产三级第一页| 欧美大片在线影院| a级日韩大片| 五十路熟女丰满大屁股| 不卡一区在线观看| 免费黄色网址在线| 亚洲欧美国产另类| 欧美大片1688网站| 中文网丁香综合网| 国产精品一区二区在线看| 久久久久无码国产精品| 欧美mv日韩mv亚洲| 性欧美18~19sex高清播放| 免费在线观看一区二区| 日本亚洲三级在线| 亚洲不卡在线播放| 欧美xxxx老人做受| 国产在线精彩视频| 欧洲成人一区二区| 美女视频第一区二区三区免费观看网站| 成人小视频免费看| 91精品国产综合久久蜜臀 | 国产精品27p| 色999日韩| 超碰人人cao| 欧美日韩美女视频| 狠狠狠综合7777久夜色撩人| 国产又爽又黄的激情精品视频| 欧美jizzhd精品欧美巨大免费| 五月天丁香社区| 日本黄色一区二区| v片在线观看| 国内精品一区二区| 蜜桃免费网站一区二区三区| 欧美激情图片小说| 日韩精品小视频| 亚洲一区二区三区久久久| 日本精品久久久久久久久久| 久久人人爽人人爽| 国产乱码精品一区二区三区精东| 欧美高跟鞋交xxxxhd| 中文字幕av一区二区三区人| av亚洲天堂网| 都市激情亚洲色图| 精品欧美色视频网站在线观看| 国产v亚洲v天堂无码| 日韩国产一区二| 精品无码人妻一区二区三区 | 新版中文在线官网| 欧美一区二区三区电影在线观看| 国产在线国偷精品免费看| 日韩福利片在线观看| 精品久久久999| 视频一区欧美| 91精品啪在线观看国产| 欧美美女黄视频| 性欧美18xxxhd| 国产 国语对白 露脸|