精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

手機可跑,3.8B參數量超越GPT-3.5!微軟發布Phi-3技術報告:秘密武器是洗干凈數據

人工智能 新聞
Scaling Laws再次失效?微軟最新的phi-3-mini模型,只用3.8B模型就擊敗了一眾7B老大哥,用iPhone14每秒可生成12個tokens!

過去幾年,借助Scaling Laws的魔力,預訓練的數據集不斷增大,使得大模型的參數量也可以越做越大,從五年前的數十億參數已經成長到今天的萬億級,在各個自然語言處理任務上的性能也越來越好。

但Scaling Laws的魔法只能施加在「固定」的數據源上,即模型如果能夠以一種新的方式與數據進行交互的話,就能實現「小模型戰勝大模型」的效果。

微軟此前關于Phi系列模型的研究工作,已經證實了「基于LLM的web數據過濾」和「LLM合成數據」的結合,使得2.7B參數量的Phi-2可以匹敵25倍參數量大模型的性能。

最近,微軟再次升級了Phi-3系列模型,最小尺寸的phi-3-mini(3.8B參數量)在更大、更干凈的數據集(包含3.3T個tokens)上進行訓練,在各大公開的學術基準和內部測試中,實現了與Mixtral 8x7B和GPT-3.5等大尺寸模型的性能。

論文鏈接:https://arxiv.org/pdf/2404.14219.pdf

相比上一代模型,phi-3還進一步調整了其穩健性、安全性和聊天格式,并且還提供了一些針對4.8T個tokens訓練的7B(phi-3-small)和14B模型(phi-3-medium)的初步參數縮放結果,兩者的能力都明顯高于phi-3-mini

phi-3-mini的尺寸也足夠小,可以部署在手機上離線使用。

小模型也有大實力

phi-3-mini的基礎模型的參數量為3.8B,采用Transformer解碼器架構,默認上下文長度為4K,加長版(phi-3-mini-128K)通過LongRope技術將上下文擴展至128K

為了更好地服務于開源社區,phi-3-mini在構建時借鑒了Llama-2模型的塊結構,并使用了相同分詞器,詞表大小為32064,也就意味著「Llama-2系列模型相關的包」可以直接適配到phi-3-mini上。

模型參數設置上,隱藏層維度為3072、具有32個頭、總共32層,使用bfloat16訓練了3.3T個tokens

phi-3-mini還針對聊天進行了微調,使用的模板為:

此外,研究人員還推出了phi-3-small模型,參數量為7B,利用tiktoken分詞器以實現更佳的多語言分詞性能,詞匯量為100352,默認上下文長度為8K;該模型遵循7B模型類別的標準解碼器架構,總共有32個層和4096個隱藏層維度,為了最小化KV緩存占用,模型還采用了分組查詢注意力機制,每4個query共享1個key

此外,phi-3-small交替使用稠密注意力和塊稀疏注意力層,以進一步減少KV緩存占用量,同時保持長上下文的檢索性能;該模型還額外使用了10%的多語言數據。

手機端的強大語言模型

得益于phi-3-mini小巧的體積,在量化到4bit的情況下,僅占用大約1.8GB的內存。

研究人員在iPhone 14(搭載A16 Bionic芯片)上部署了量化后的phi-3-mini模型,在完全離線運行的狀態下,實現了每秒12個tokens的超高性能。

訓練方法

模型的訓練遵循「Textbooks Are All You Need」的工作序列,利用高質量的訓練數據來提升小型語言模型的性能,同時突破了標準的規模法則(scaling-laws):phi-3-mini僅用3.8B的總參數量,就能達到GPT-3.5或Mixtral等高性能模型的水平(Mixtral的總參數量為45B)。

模型的訓練數據包括來自各種開放互聯網源的經過嚴格篩選的網絡數據,以及合成的LLM生成數據。

預訓練分為兩個不相交且連續的階段:

第一階段主要使用網絡資源,主要目的是教導模型通用知識和語言理解的能力;

第二階段結合了經過更嚴格篩選的網絡數據(第一階段使用的子集)和一些合成數據,教授模型邏輯推理和各種專業技能。

數據最優范圍(Data Optimal Regime)

與以往在「計算最優范圍」或「過度訓練范圍」訓練語言模型的工作不同,研究人員主要關注在「特定規模下」的數據質量:通過校準訓練數據,使其更接近小型模型的數據最優范圍。

主要篩選網絡數據以包含正確水平的「知識」能力,并保留更多可能提高模型「推理能力」的網頁,例如英超聯賽某一天的比賽結果可能對大模型來說算比較好的訓練數據,但對phi-3-mini來說,則需要去除這類信息,以便為迷你尺寸模型的「推理」留出更多模型容量。

為了在更大尺寸的模型上驗證數據質量,研究人員訓練了一個14B尺寸的phi-3-medium模型,總共處理了4.8T個tokens(與phi-3-small相當),結果發現,某些性能指標從7B參數提升到14B參數時的改善,并沒有從3.8B參數提升到7B參數時那么明顯,可能意味著數據組合需要進一步優化,以便更好地適應14B參數模型的「數據最優狀態」。

后處理

在phi-3-mini的訓練后處理中,主要包括兩個階段:

1. 有監督微調(SFT)

SFT使用了經過精心策劃的、跨多個不同領域的高質量數據,包括數學、編程、邏輯推理、對話、模型特性和安全性等,在訓練初期只使用英語的樣本。

2. 直接偏好優化(DPO)

DPO的數據則包括了聊天格式的數據、邏輯推理任務,以及負責任的人工智能(RAI)相關的工作。

研究人員利用DPO引導模型避免不良行為,主要方法是將這些不希望出現的結果標記為「拒絕」。

除了在數學、編程、邏輯推理、魯棒性和安全性方面的提升外,訓練后處理還使得語言模型轉變成了一個用戶可以高效且安全地進行交互的AI助手。

在長上下文版本phi-3-mini-128K中,首先是在模型訓練的中期引入長上下文,然后在訓練后處理階段,同時使用SFT和DPO,進行長-短上下文混合的訓練。

學術基準性能

研究人員在一系列公開基準測試中,對比了phi-2、Mistral-7b-v0.1、Mixtral-8x7b、Gemma 7B、Llama-3-instruct8b和GPT-3.5模型的常識推理、邏輯推理能力。

從結果來看,phi-3-mini模型以3.8b的體量超越了一眾7B, 8B模型,甚至Mixtral(8*7b)都敗下陣來,和GPT-3.5各有勝負,算是打了個平手。

同尺寸下,7b尺寸的Phi-3-small性能提升相當明顯。

目前,評估語言模型的標準方法是使用少量樣本提示(few-shot prompts),模型都是在溫度設置為0的情況下進行評估。

安全性

Phi-3-mini的構建嚴格遵守了微軟的負責任人工智能(AI)準則,整個開發過程囊括了在模型訓練后進行安全對齊、通過紅隊策略進行測試、以及自動化的評估,覆蓋了眾多與負責任AI相關的潛在風險類別。

模型的訓練過程中用到了一些提升模型有用性和無害性的數據集,其中部分基于先前研究的啟發進行了調整,并結合了多個由微軟內部生成的數據集,以針對訓練后的安全處理中的負責任AI風險類別進行優化。

微軟內部的獨立紅隊對phi-3-mini進行了細致的審查,旨在訓練后的階段識別出進一步改進的空間;研究團隊根據紅隊的反饋,精心挑選并創建了額外的數據集以解決問題,顯著降低了模型生成有害回復的頻率。

在內部進行的負責任AI基準測試中,與phi-2、Mistral-7b-v0.1、Gemma 7b和Llama-3-instruct-8b等模型相比,phi-3-mini-4k和phi-3-mini-128k展現出了更好的性能。

測試過程中,使用GPT-4來模擬五種不同類別的多輪對話,并以此來評估模型的回復。

測試中的「無根據性」(ungroundedness)評分從0(fully grounded)到4(not grounded),用來衡量模型回應的信息是否與給定的提示相關。

在其他風險類別中,模型的回應根據其有害性的嚴重程度被評分,范圍從0(無傷害)到7(極度傷害);缺陷率(DR-x)通過計算得分等于或超過x嚴重度的樣本比例來得出。

Phi-3-mini的缺陷

在大型語言模型的能力方面,phi-3-mini雖然在語言理解力和推理能力上與更大型的模型旗鼓相當,但由于其規模的限制,在處理某些特定任務時仍然存在一些固有的局限性。

簡單來說,這個模型并沒有足夠的內存空間去存儲海量的事實性知識,在一些需要大量背景知識的任務上表現得尤為明顯,比如在TriviaQA問答任務中的表現就不夠好,但這個問題可以通過與搜索引擎的結合使用來解決。

左:無搜索;右:有搜索

模型的容量限制還體現在將語言限制為英語,對于小型語言模型來說,探索其多語言能力是未來一個重要的發展方向,通過增加多語言數據,目前已經取得了一些初步的積極結果。

此外,研究人員表示,雖然花了很大的努力讓模型遵循負責任人工智能(RAI)的原則,但和其他大多數大型語言模型一樣,phi-3-mini在處理事實性錯誤(幻覺)、偏見的再現或放大、不當內容生成以及安全問題等方面仍然存在挑戰。

通過使用精心策劃的訓練數據、針對性的后期訓練調整,以及吸納紅隊測試的反饋,已經在很大程度上緩解了這些問題,但要完全克服這些難題,仍然有很長的路要走,需要進行更多的研究和改進。

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-04-24 12:47:17

模型AI機器人

2017-09-25 18:33:00

美國硅谷互聯網

2024-06-17 13:39:45

2013-10-16 09:28:14

亞馬遜AWSSDN

2011-08-11 17:05:26

2023-09-25 09:58:25

AI框架

2019-11-27 10:38:37

數據分析數據準備工具

2013-10-16 09:33:36

亞馬遜AWSSDN

2024-07-11 08:34:48

2023-02-24 10:26:34

語音AI人工智能

2019-11-27 10:40:34

數據工具CIO

2024-09-26 17:47:41

2025-05-27 10:00:00

Python數據類代碼

2014-01-07 10:46:39

2020-04-29 09:24:48

Python數據工具

2014-02-11 09:05:38

微軟Autopilot

2023-06-27 09:14:52

微軟LLM AI 模型

2024-11-06 14:30:38

2024-06-28 09:00:00

人工智能生成式人工智能

2024-07-18 12:53:13

點贊
收藏

51CTO技術棧公眾號

欧美日韩日日摸| 国产又黄又爽视频| 亚洲av无码乱码国产麻豆| 国产精品极品在线观看| 香蕉久久久久久久av网站| 欧美日韩午夜在线| 精品视频高清无人区区二区三区| av免费播放网站| av在线播放资源| 97久久视频| 欧美日韩国产激情| 成人精品一区二区三区| www.色多多| 亚洲综合伊人久久大杳蕉| 日韩成人一级大片| 亚洲国产精品久久| 在线一区高清| 中文字幕av免费观看| 西野翔中文久久精品国产| 一区二区三区欧美日| 欧美激情手机在线视频 | www.精品在线| 亚洲欧美日韩综合在线| 一区二区蜜桃| 欧美日韩中文精品| 一卡二卡三卡视频| 国产www免费观看| 第一会所亚洲原创| 日韩欧美视频一区二区三区| 懂色中文一区二区三区在线视频| 无码人妻精品中文字幕| www.一区| 国产精品麻豆欧美日韩ww| 国产精品电影一区| 少妇无套高潮一二三区| 韩国精品主播一区二区在线观看| 91视频com| 91精品国产乱码久久久久久蜜臀| 毛茸茸free性熟hd| 国内高清免费在线视频| 国产成人精品网址| 欧美激情精品久久久久久黑人 | 国产综合一区二区| 亚洲精品少妇网址| 激情综合网婷婷| 青青草在线免费视频| 久久精品男女| 日韩一级黄色av| 中文字幕一区二区在线观看视频| 黄色大片在线播放| 国产乱子伦视频一区二区三区 | 黄色免费在线观看网站| 久久精品人人做人人爽人人| 国产成+人+综合+亚洲欧美丁香花| 欧美精品黑人猛交高潮| 激情开心成人网| 国产精品久久久久久久久免费樱桃 | 午夜伦理一区二区| 国产一区免费在线| 黄网在线观看视频| 精品日韩欧美一区| 91精品国产综合久久婷婷香蕉| 亚洲色图都市激情| 无码国产精品96久久久久| 国产成人免费xxxxxxxx| 亚洲最大福利网站| 中文字幕视频网站| 999成人网| 日韩小视频在线观看| 永久免费观看片现看| 成人在线tv视频| 欧美最新大片在线看| 99re6这里有精品热视频| 黄色在线观看网站| 亚洲啪啪综合av一区二区三区| 国产精品一区二区三区精品| 波多野结衣一区二区三区在线| 91精品国产麻豆国产在线观看 | 午夜免费一区二区| 久久精品视频免费看| 国产精品毛片高清在线完整版| 制服国产精品| 在线观看电影av| 亚洲在线免费播放| 精品人妻一区二区三区四区在线| 日本综合在线| 成人久久视频在线观看| 国产精品视频永久免费播放| 亚洲欧美精品久久| 色一区二区三区四区| 亚洲精品电影在线观看| 亚洲理论中文字幕| 日韩中文字幕无砖| 欧美三级视频在线观看| 国产免费中文字幕| 成人直播视频| 亚洲国产一区二区a毛片| 亚洲国产精品123| 天堂在线视频免费| 国产高清精品久久久久| 国产私拍一区| 国产一级片在线| 91在线观看视频| 成人在线观看av| 色播色播色播色播色播在线| 国产精品看片你懂得| 免费人成在线观看视频播放| 成人影院网站| 日韩一区二区在线观看视频播放| 欧美伦理片在线看| 精品捆绑调教一区二区三区| 一区二区三区四区蜜桃| 欧美三级一级片| 亚洲福利影视| 欧美天天综合网| 日日摸天天爽天天爽视频| 蜜桃av在线| 精品国产乱码久久久久久虫虫漫画| 亚洲高清在线免费观看| 一区二区三区在线资源| 日韩三级在线免费观看| 国产成人无码精品久久二区三| 免费在线不卡视频| 一区二区三区视频在线观看视频| 国产精品毛片a∨一区二区三区| 国产a级片网站| 含羞草www国产在线视频| 亚洲动漫第一页| 全黄性性激高免费视频| 日日夜夜综合| 国产性色av一区二区| 我和岳m愉情xxxⅹ视频| 一本一道久久综合狠狠老| 国产精品国产亚洲伊人久久 | 午夜影院日韩| 99久久99久久| xxxx18国产| 东方aⅴ免费观看久久av| 色噜噜一区二区| av一本在线| 亚洲欧洲99久久| 欧美激情亚洲天堂| 九色porny丨首页入口在线| 欧美精品777| 人妻精油按摩bd高清中文字幕| av成人app永久免费| 精品国产一区二区三区久久狼黑人 | va视频在线观看| 国产精品视频第一区| av网站在线观看不卡| 加勒比久久高清| 亚洲美女视频网站| 中文天堂资源在线| 老司机亚洲精品| 成人精品一区二区三区电影免费| 精品999视频| 色综合久久88色综合天天 | 欧美aa在线视频| 国产日韩欧美在线观看| www.久久久久久久久久| 亚洲同性gay激情无套| 亚洲a级黄色片| 激情av综合| 国外成人在线直播| 亚洲视频在线观看一区二区| 国产一区二区毛片| 艳色歌舞团一区二区三区| 欧美hdxxxx| 在线亚洲高清视频| 先锋影音av在线| 日本中文字幕一区| 成人欧美一区二区三区在线观看 | 国产清纯美女被跳蛋高潮一区二区久久w | 最近2019年日本中文免费字幕| 日本青青草视频| 亚洲自拍另类| 欧美三级网色| 国产精品一区hongkong| 亚洲国产精品va在线| 久草手机在线观看| 久久精品夜夜夜夜久久| 国产一线二线三线女| 国产精品久av福利在线观看| 欧美在线一区二区视频| 亚洲乱码国产乱码精品精大量| 欧美日韩精选| 国产成人精彩在线视频九色| 国产黄在线看| 精品欧美国产一区二区三区| 免费看涩涩视频| 亚洲精品久久久| 国产精品我不卡| 亚洲欧美韩国| 亚洲精品在线观| 男女性高潮免费网站| 日本vs亚洲vs韩国一区三区| 亚洲午夜精品一区二区| 亚洲天堂中文字幕在线观看| 欧美最猛性xxxxx免费| 日韩伦理在线观看| 日韩av最新在线观看| 久久久久久久蜜桃| 国产揄拍国内精品对白| av之家在线观看| 成人动漫视频| 国产精品免费在线免费| 性网站在线观看| 欧美一区二区三区视频免费 | 欧美污视频网站| 91影院成人| 精品一卡二卡三卡四卡日本乱码| 999国产精品亚洲77777| 久久久久久中文| 在线免费看黄| 日韩国产欧美区| 国产美女免费看| 亚洲欧洲日产国产综合网| 亚洲国产精品第一页| 红桃视频亚洲| 国产超碰91| www.成人在线视频| 91av在线不卡| 金瓶狂野欧美性猛交xxxx | 高清国产在线一区| 欧美成人黄色| 久久国产精品99国产精| 国产精品久久久久久69| 日韩欧美一区二区三区久久| jizz亚洲少妇| 中文字幕av免费专区久久| 在线观看av日韩| 99精品国产在热久久下载| 精品乱子伦一区二区三区| 9.1麻豆精品| 欧美乱人伦中文字幕在线| 亚洲精品久久久蜜桃动漫 | 国产美女自慰在线观看| 欧美亚洲国产怡红院影院| 天天插天天操天天干| 91热门视频在线观看| 超级砰砰砰97免费观看最新一期| 青青草国产精品亚洲专区无| 欧美牲交a欧美牲交aⅴ免费真| 亚洲视频日本| 久久男人资源站| 亚洲色图88| 色乱码一区二区三区熟女| 视频一区日韩精品| 成人性生交大片免费看小说 | 一本一道波多野毛片中文在线| 亚洲免费精彩视频| 毛片免费在线观看| 欧美精品 国产精品| 特级西西444www大胆免费看| 亚洲精品日韩一| 人妻 丝袜美腿 中文字幕| 国产久卡久卡久卡久卡视频精品| 波多结衣在线观看| 韩日精品视频| 日本a级片在线观看| 综合一区二区三区| 国产精品免费一区二区| 亚洲三级av| 精品国产一区二区三区日日嗨 | 开心九九激情九九欧美日韩精美视频电影| 三年中文高清在线观看第6集| 日韩在线看片| 最新视频 - x88av| 国产成人1区| 91麻豆精品秘密入口| 日本在线成人| 国产一区精品在线| 亚洲自拍电影| 91网免费观看| 成功精品影院| 青青草成人激情在线| 亚洲图色一区二区三区| 国产精品一区二区免费| 同性恋视频一区| 天堂精品一区二区三区| 亚洲女同中文字幕| 国产亚洲黄色片| 久久久精品日韩| 天天综合网久久| 国产不卡免费视频| www.午夜av| 成人晚上爱看视频| 欧洲女同同性吃奶| 成人av资源在线观看| √天堂资源在线| 成人网男人的天堂| 粉嫩精品久久99综合一区| 亚洲精品免费在线播放| 久久国产黄色片| 欧美精品v日韩精品v韩国精品v| 六月婷婷综合网| 日韩一区二区三区在线视频| 手机看片福利永久| 正在播放欧美一区| 欧美美乳在线| 久久精品99无色码中文字幕| av在线天堂| 中文字幕精品久久| 久久香蕉av| 国产精品欧美亚洲777777| 91国内精品白嫩初高生| 色综合久久久久久久久五月| 国产一区二区三区四区老人| 一区二区三区国产免费| 成人一区二区三区视频| 国产一区二区三区视频播放| 欧美激情一区二区三区在线| 久久久久久久久久久久久久久久久| 欧美性猛交xxxx乱大交极品| 国产aⅴ爽av久久久久成人| 日韩av中文字幕在线| 国产福利视频在线| 欧美不卡视频一区发布| 性高爱久久久久久久久| 国产女人水真多18毛片18精品| 99精品视频在线| 欧洲美女和动交zoz0z| 男女av一区三区二区色多| 一级全黄裸体片| av亚洲精华国产精华| 一级欧美一级日韩片| 91偷拍与自偷拍精品| 在线免费日韩av| 欧美日韩在线免费视频| 毛片在线播放网站| 57pao成人永久免费视频| 精品91久久| 国产伦精品一区二区三区四区视频| 永久91嫩草亚洲精品人人| 国产一级做a爰片久久| 久久免费精品国产久精品久久久久| 小早川怜子久久精品中文字幕| 香蕉乱码成人久久天堂爱免费| av网站在线免费看| 日韩一区二区av| 欧美一级做a| 亚洲精品成人久久久998| 日韩在线一区二区| xxxxx在线观看| 日本高清成人免费播放| 91成人一区二区三区| 日韩欧美精品在线| 日韩美女一级视频| 91精品国产高清久久久久久91| 一区二区亚洲视频| 美女av免费观看| 久久久久99| 日韩乱码人妻无码中文字幕久久| 福利精品视频在线| 天天综合天天综合| 97视频在线观看视频免费视频 | 欧美 日韩 国产一区二区在线视频| www.这里只有精品| 中文字幕在线一区免费| 91精东传媒理伦片在线观看| 久久精品亚洲精品| 国产色99精品9i| 欧美精品一区二区三区在线看午夜 | 国产卡一卡二在线| 国产麻豆精品视频| 青青草免费av| 日韩欧美亚洲一二三区| 日本免费不卡| 国产精品18久久久久久首页狼 | 国产寡妇亲子伦一区二区三区四区| 欧美日本一区二区三区四区| 香蕉视频免费在线播放| 91亚洲国产精品| 国产伦精品一区二区三区视频| 116极品美女午夜一级| 久久久99免费| 中文字幕av免费观看| 精品国偷自产在线视频| a看欧美黄色女同性恋| 播放灌醉水嫩大学生国内精品| 久久久久久麻豆| 一本色道久久综合精品婷婷| 欧美放荡办公室videos4k| 久久香蕉精品香蕉| 久久久久免费精品| 亚洲欧洲成人av每日更新| 老牛影视av牛牛影视av| 国产97免费视| 日韩一级电影| 国产九九在线视频| 亚洲女同一区二区| 三级在线播放| 国产在线观看精品一区二区三区| 激情综合电影网| 香蕉网在线视频| 亚洲美女免费在线| 香蕉视频网站在线| 91免费国产网站| 国产午夜久久| 欧美成人三级伦在线观看|