精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

微軟小模型擊敗大模型:27億參數,手機就能跑

人工智能 新聞
今天,微軟公布了 Phi-2 模型的更多細節以及全新的提示技術 promptbase。這個僅 27 億參數的模型在大多數常識推理、語言理解、數學和編碼任務上超越了 Llama2 7B、Llama2 13B、Mistral 7B,與 Llama2 70B 的差距也在縮小(甚至更好)。

上個月,微軟 CEO 納德拉在 Ignite 大會上宣布自研小尺寸模型 Phi-2 將完全開源,在常識推理、語言理解和邏輯推理方面的性能顯著改進。

圖片

今天,微軟公布了 Phi-2 模型的更多細節以及全新的提示技術 promptbase。這個僅 27 億參數的模型在大多數常識推理、語言理解、數學和編碼任務上超越了 Llama2 7B、Llama2 13B、Mistral 7B,與 Llama2 70B 的差距也在縮小(甚至更好)。

同時,小尺寸的 Phi-2 可以在筆記本電腦、手機等移動設備上運行。納德拉表示,微軟非常高興將一流的小語言模型(SLM)和 SOTA 提示技術向研發人員分享。

圖片

今年 6 月,微軟在一篇題為《Textbooks Are All You Need》的論文中,用規模僅為 7B token 的「教科書質量」數據訓練了一個 1.3B 參數的模型 ——phi-1。盡管在數據集和模型大小方面比競品模型小幾個數量級,但 phi-1 在 HumanEval 的 pass@1 上達到了 50.6% 的準確率,在 MBPP 上達到了 55.5%。phi-1 證明高質量的「小數據」能夠讓模型具備良好的性能。

隨后的 9 月,微軟又發表了論文《Textbooks Are All You Need II: phi-1.5 technical report》,對高質量「小數據」的潛力做了進一步研究。文中提出了 Phi-1.5,參數 13 億,適用于 QA 問答、代碼等場景。

如今 27 億參數的 Phi-2,再次用「小身板」給出了卓越的推理和語言理解能力,展示了 130 億參數以下基礎語言模型中的 SOTA 性能。得益于在模型縮放和訓練數據管理方面的創新, Phi-2 在復雜的基準測試中媲美甚至超越了 25 倍于自身尺寸的模型。

微軟表示,Phi-2 將成為研究人員的理想模型,可以進行可解釋性探索、安全性改進或各種任務的微調實驗。微軟已經在 Azure AI Studio 模型目錄中提供了 Phi-2,以促進語言模型的研發。

Phi-2 關鍵亮點

語言模型規模增加到千億參數,的確釋放了很多新能力,并重新定義了自然語言處理的格局。但仍存在一個問題:是否可以通過訓練策略選擇(比如數據選擇)在較小規模的模型上同樣實現這些新能力?

微軟給出的答案是 Phi 系列模型,通過訓練小語言模型實現與大模型類似的性能。Phi-2 主要在以下兩個方面打破了傳統語言模型的縮放規則。

首先,訓練數據的質量在模型性能中起著至關重要的作用。微軟通過重點關注「教科書質量」數據將這一認知發揮到了極致,他們的訓練數據中包含了專門創建的綜合數據集,教給模型常識性知識和推理,比如科學、日常活動、心理等。此外通過精心挑選的 web 數據進一步擴充自己的訓練語料庫,其中這些 web 數據根據教育價值和內容質量進行過濾。

其次,微軟使用創新技術進行擴展,從 13 億參數的 Phi-1.5 開始,將知識逐漸嵌入到了 27 億參數的 Phi-2 中。這種規模化知識遷移加速了訓練收斂,并顯著提升了 Phi-2 的基準測試分數。

下圖 2 為 Phi-2 與 Phi-1.5 之間的比較,除了 BBH(3-shot CoT)和 MMLU(5-shot)之外,所有其他任務都利用 0-shot 進行評估。

訓練細節

Phi-2 是一個基于 Transformer 的模型,旨在預測下一個單詞,在用于 NLP 與編碼的合成數據集和 Web 數據集上進行訓練,在 96 個 A100 GPU 上花費了 14 天。

Phi-2 是一個基礎模型,沒有通過人類反饋強化學習 (RLHF) 進行對齊,也沒有進行指令微調。盡管如此,與經過調整的現有開源模型相比,Phi-2 在毒性和偏見方面仍然表現得更好,如下圖 3 所示。

圖片

實驗評估

首先,該研究在學術基準上對 Phi-2 與常見語言模型進行了實驗比較,涵蓋多個類別,包括:

  • Big Bench Hard (BBH) (3 shot with CoT)
  • 常識推理(PIQA、WinoGrande、ARC easy and challenge、SIQA)、
  • 語言理解(HellaSwag、OpenBookQA、MMLU(5-shot)、SQuADv2(2-shot)、BoolQ)
  • 數學(GSM8k(8 shot))
  • 編碼(HumanEval、MBPP(3-shot))

Phi-2 僅有 27 億個參數,卻在各種聚合基準上性能超越了 7B 和 13B 的 Mistral 模型、Llama2 模型。值得一提的是,與大 25 倍的 Llama2-70B 模型相比,Phi-2 在多步驟推理任務(即編碼和數學)方面實現了更好的性能。

此外,盡管模型較小,但 Phi-2 的性能可與最近谷歌發布的 Gemini Nano 2 相媲美。

由于許多公共基準可能會泄漏到訓練數據中,研究團隊認為測試語言模型性能的最佳方法是在具體用例上對其進行測試。因此,該研究使用多個微軟內部專有數據集和任務對 Phi-2 進行了評估,并再次將其與 Mistral 和 Llama-2 進行比較,平均而言,Phi-2 優于 Mistral-7B,Mistral-7B 優于 Llama2 模型(7B、13B、70B)。

圖片


圖片

此外,研究團隊還針對研究社區常用的 prompt 進行了廣泛的測試。Phi-2 的表現與預期一致。例如,對于一個用于測試模型解決物理問題的能力的 prompt(最近用于評估 Gemini Ultra 模型),Phi-2 給出了以下結果:

圖片

圖片

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-12-13 11:16:34

微軟Phi-2大型語言模型

2025-03-13 09:12:35

2023-12-01 12:31:22

AI模型

2022-08-18 15:13:37

模型參數

2025-06-27 10:08:19

2023-12-13 09:47:38

微軟人工智能

2025-03-19 09:00:00

模型AI訓練

2024-07-04 15:32:13

2020-02-24 10:51:25

微軟開源Windows

2025-07-08 03:22:00

大模型參數AI

2022-08-20 07:52:56

語言模型參數PaLM

2025-10-17 09:17:09

2023-10-29 22:41:29

模型開源

2023-10-28 13:29:27

2025-08-05 09:13:12

人工智能AGIHRM

2025-09-08 09:06:16

2022-06-25 21:17:15

人工智能訓練

2023-06-20 13:38:22

點贊
收藏

51CTO技術棧公眾號

九九九久久久久久久| 在线播放 亚洲| 国产无遮挡又黄又爽又色视频| 欧美三级情趣内衣| 日韩一级免费观看| 情侣黄网站免费看| 在线视频观看国产| 久久精品视频在线看| 亚洲综合在线小说| 精品久久久久久久久久久国产字幕 | 欧美性色综合| 中国china体内裑精亚洲片| 中文字幕永久免费| yy6080久久伦理一区二区| 午夜精品一区二区三区电影天堂 | 国产在线精品一区二区三区》| 中国一级特黄视频| 亚洲精品影视| 欧美成人在线免费视频| 亚洲AV无码成人精品区明星换面| 亚州一区二区| 8x福利精品第一导航| 欧洲熟妇精品视频| 国产资源在线观看入口av| 亚洲少妇中出一区| 亚洲欧洲精品一区二区三区波多野1战4 | 久久久久久久黄色| 97精品国产福利一区二区三区| 亚洲激情小视频| 秋霞午夜鲁丝一区二区| 在线播放成人| 欧美色网站导航| 日本在线视频www| 高清精品在线| 午夜天堂影视香蕉久久| 女人被男人躁得好爽免费视频| 秋霞午夜在线观看| 中国av一区二区三区| 免费精品视频一区| 天堂v在线观看| 成人aa视频在线观看| 成人毛片网站| www香蕉视频| 国产激情一区二区三区| 91免费国产视频| 国产精品久久久久久免费播放| 免费人成网站在线观看欧美高清| 国产精品美乳在线观看| 久久久国产免费| 全国精品久久少妇| 国产噜噜噜噜噜久久久久久久久| 中文精品久久久久人妻不卡| 久久精品动漫| 国产精品偷伦一区二区 | 日韩一区二区在线看| 极品粉嫩美女露脸啪啪| 国内不卡的一区二区三区中文字幕 | 亚洲天堂中文网| 久久99国产精品麻豆| 成人激情视频网| 国产高清视频免费| 成人性视频免费网站| 国内不卡一区二区三区| 奇米影视888狠狠狠777不卡| 国产午夜精品在线观看| 亚洲欧美日韩精品在线| 18+激情视频在线| 亚洲曰韩产成在线| 国产a级一级片| 欧美色999| 91精品国产91热久久久做人人| 三级av免费看| 米奇精品关键词| 亚洲美女激情视频| 天堂资源在线视频| 中文一区一区三区免费在线观看| 欧美精品久久久久久久久久| 日韩免费视频一区二区视频在线观看| 午夜在线精品| 国产欧美va欧美va香蕉在| 国产人妻精品一区二区三| 风间由美一区二区三区在线观看| 久久伊人资源站| 日本美女在线中文版| 亚洲国产另类精品专区| 国产xxxxx视频| 精品久久久久久久久久岛国gif| 欧美精品一区二区久久婷婷| 精品国产成人亚洲午夜福利| 亚洲精品国产首次亮相| 欧美中文字幕在线播放| 国产伦精品一区二区三区免.费| 成人免费视频视频| 亚洲高清视频在线观看| 俺来也官网欧美久久精品| 在线免费观看日本一区| 欧美性猛交xx| 精品久久视频| 97在线视频一区| 国产精品热久久| 久久综合精品国产一区二区三区| 亚洲免费av网| 欧美xnxx| 亚洲成人av片| 三级av在线免费观看| 一本色道久久综合一区| 成人午夜在线影院| 国产福利电影在线| 91亚洲自偷观看高清| 日韩av电影天堂| 亚洲自拍偷拍区| 电影av在线| 欧美性xxxxx| 中国特级黄色片| 国产精品国产三级国产在线观看| 欧美中文字幕视频在线观看| 国产自产一区二区| 中文字幕色av一区二区三区| 男人搞女人网站| 青青草这里只有精品| 久久成人av网站| 在线观看日批视频| 26uuu成人网一区二区三区| 男人c女人视频| 91丨精品丨国产| 中文字幕免费精品一区| 午夜精品免费观看| 337p粉嫩大胆噜噜噜噜噜91av| 国产激情片在线观看| 高清国产一区二区三区四区五区| 中文字幕亚洲激情| 国产美女www| 久久久久久久综合色一本| 鲁一鲁一鲁一鲁一澡| 久久久伦理片| 久久免费视频这里只有精品| 亚洲av无码乱码国产麻豆| 亚洲女同一区二区| 永久免费看片在线观看| 一区二区三区在线观看免费| 91精品免费久久久久久久久| 在线视频自拍| 欧美浪妇xxxx高跟鞋交| 久久精品日韩无码| 久久成人免费日本黄色| 一本色道久久综合亚洲精品婷婷| 91久久久久久白丝白浆欲热蜜臀| 一区二区三区精品99久久| 波多野结衣黄色| 国产精品天美传媒沈樵| 天天干天天爽天天射| 四季av一区二区凹凸精品| 国产欧美日韩91| 老司机在线视频二区| 91精品视频网| 久久精品久久国产| a亚洲天堂av| 国产精品视频一区二区三区四区五区| 日韩有码av| 国产精欧美一区二区三区| 91在线视频| 日韩一区二区麻豆国产| 欧美成人片在线观看| 成人丝袜视频网| 日本日本19xxxⅹhd乱影响| 精品视频亚洲| 91手机视频在线观看| 欧美另类tv| 亚洲精品综合久久中文字幕| 精品乱码一区内射人妻无码| 亚洲色图在线视频| 日韩综合第一页| 日韩中文欧美在线| 久久久久久久久影视| 国产精品国产| 国产精品99久久久久久白浆小说 | 亚洲无码精品在线播放| 亚洲精品免费视频| 在线观看国产网站| 蜜臀久久久久久久| 91成人综合网| 欧美日韩伦理| 99久久综合狠狠综合久久止| 色是在线视频| 久久国产精品久久久| 天堂av网在线| 制服丝袜亚洲网站| 欧产日产国产69| 亚洲色图欧美激情| 国产精品1000部啪视频| 国产真实乱子伦精品视频| 欧美国产亚洲一区| 久久精品青草| 欧美日韩精品免费看| 久久国际精品| 国产精品久久av| av电影在线地址| 久久伊人精品视频| 国产在线视频福利| 精品第一国产综合精品aⅴ| 在线观看国产小视频| 午夜精品成人在线| 国产女人18水真多毛片18精品| 国产亚洲一区二区三区在线观看| 免费国偷自产拍精品视频| 日本中文字幕一区二区视频| 蜜臀av无码一区二区三区| 99久久久久| 欧美亚州在线观看| 亚洲经典视频| 91久久久精品| 成人国产精品| 国产成人在线视频| 99在线视频影院| 日日噜噜噜夜夜爽亚洲精品| 九色在线免费| 亚洲欧美变态国产另类| 蜜臀av在线观看| 欧美xxxxxxxx| 国产精品视频一二区| 欧美主播一区二区三区美女| 草久视频在线观看| 亚洲高清在线精品| 久久久久久久九九九九| 亚洲免费av高清| 天天操夜夜操av| 国产精品第13页| 女人黄色一级片| 国产拍欧美日韩视频二区| 人妻无码一区二区三区| 成人高清视频在线观看| 农村末发育av片一区二区| 国产精品影音先锋| 先锋资源在线视频| 国产乱码精品一区二区三区av| 毛片毛片毛片毛| 激情六月婷婷综合| 超碰91在线播放| 国产精品1区2区| 亚洲精品一区二区18漫画 | 97人人模人人爽人人少妇| 日韩美女在线| 成人国产精品久久久| 欧美日韩卡一| 91精品视频在线| 麻豆国产一区二区三区四区| 亚洲在线视频福利| 香港久久久电影| 国产一区二区三区高清视频| 牛牛影视一区二区三区免费看| 激情五月综合色婷婷一区二区 | 伊人久久大香线蕉av一区| 久久在线视频| 99re8这里只有精品| 狠狠色综合网| 人妻熟妇乱又伦精品视频| 久久aⅴ乱码一区二区三区| 国产裸体舞一区二区三区 | 亚洲成人激情小说| 国产ts人妖一区二区| 污污污www精品国产网站| 99久久国产综合色|国产精品| 六十路息与子猛烈交尾| 91色在线porny| 国产精品www爽爽爽| 最新国产成人在线观看| 国产第一页第二页| 欧美性感美女h网站在线观看免费 欧美性xxxx在线播放 | 97人人精品| 日本一级黄视频| 久久国产99| 爱豆国产剧免费观看大全剧苏畅| 国产激情一区二区三区四区 | 精品黑人一区二区三区在线观看 | 在线观看视频一区| 国产美女三级无套内谢| 亚洲高清不卡av| av在线资源网| 欧美理论电影在线播放| 天堂电影一区| 91精品久久久久久综合乱菊 | 亚洲精品久久久久| 亚洲精品承认| 久久久久一本一区二区青青蜜月| 欧美亚洲大片| 粉嫩高清一区二区三区精品视频| 久久av资源| 国产精品一色哟哟| 日本大胆欧美人术艺术动态| 久久久久久久久久影视| 国产欧美一区二区精品性色| 国产女人18水真多毛片18精品| 狠狠久久亚洲欧美专区| 国产精品女同一区二区| 亚洲精品在线不卡| 在线观看免费高清完整| 2019最新中文字幕| 欧一区二区三区| 亚洲成人a**址| 中文精品视频| 69久久精品无码一区二区 | 亚洲午夜精品久久久久久浪潮| 黑人一区二区| 不卡的在线视频| 久久久久久久综合日本| 日本少妇bbwbbw精品| 制服丝袜亚洲播放| 国产高清一级毛片在线不卡| 久久全球大尺度高清视频| 在线视频成人| 亚洲国产午夜伦理片大全在线观看网站 | 欧美日韩亚洲一| 国产成人在线视频网址| 五月天色婷婷丁香| 欧美性三三影院| 欧美精品少妇| 69av成年福利视频| 99国产精品免费网站| 日本一本草久p| 久久66热re国产| 永久免费毛片在线观看| 色综合久久六月婷婷中文字幕| 亚洲精品久久久久久动漫器材一区| 久久亚洲精品毛片| 色综合视频一区二区三区44| 视频三区二区一区| 青青草成人在线观看| 香蕉网在线播放| 欧美特级www| 亚洲av成人精品毛片| 91精品国产色综合久久不卡98口| 久久精品免视看国产成人| 狠狠干视频网站| 国产美女精品人人做人人爽| 在线免费看av网站| 91.麻豆视频| 黄色片免费在线观看| 91精品久久久久久久久久| 99精品视频精品精品视频 | 国产日本亚洲| 白白操在线视频| 丁香婷婷综合网| 日韩免费视频网站| 亚洲精品国产精品国自产观看浪潮| 成人在线黄色电影| 久热国产精品视频一区二区三区| 亚洲一区观看| 在线不卡av电影| 欧美在线色视频| 美女av在线播放| 51国偷自产一区二区三区| 黄色日韩精品| 国产熟妇搡bbbb搡bbbb| 色8久久人人97超碰香蕉987| wwwxxx在线观看| 国产色视频一区| 欧美精品自拍| 88av在线播放| 在线视频欧美区| 日本中文字幕伦在线观看| 51国偷自产一区二区三区的来源| 亚洲精品激情| 第一次破处视频| 欧美一区二区三区啪啪| 韩国日本一区| 日本一区二区久久精品| 久久精品99国产精品| 久久精品免费av| 亚洲一区第一页| 一区二区三区| 青青草视频在线免费播放| 久久久久国产精品麻豆ai换脸| 国产精品久久久久久免费播放| 欧美极品少妇xxxxx| 国产精品亚洲人成在99www| 一区二区三区欧美精品| 亚洲成a人v欧美综合天堂| 91ph在线| 国内视频一区| 久久国产精品一区二区| 国产午夜福利一区二区| 国产小视频91| 亚洲一区二区三区免费| 成年人免费大片| 夜夜操天天操亚洲| 成人高清免费在线播放| 国产精华一区| 日本一不卡视频| 日韩欧美亚洲视频| 中文字幕在线观看日韩| 第一区第二区在线| 久久黄色片网站| 欧美日韩免费在线| 成人高清免费在线| 日韩高清国产精品| 成人免费看视频| 国产精品熟女久久久久久| 人人爽久久涩噜噜噜网站| 一精品久久久| 黄大色黄女片18免费|