精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

碾壓Llama2!微軟13億參數(shù)phi-1.5,單個A100訓練,刷新SOTA

人工智能 新聞
微軟推出了一個全新預訓練模型phi-1.5,共有13億參數(shù),能做QA問答、聊天和寫代碼等等。

模型越大,能力越強嗎?

然而,事實并非如此。

近日,微軟研究人員推出了一個模型phi-1.5,僅有13億參數(shù)。

論文地址:https://arxiv.org/pdf/2309.05463.pdf

具體來說,在常識推理、語言技能,phi-1.5表現(xiàn)與其他模型相當。同時在多步推理上,遠遠超過其他大模型。

phi-1.5展現(xiàn)出了許多大模型具備的能力,能夠進行「一步一步地思考」,或者進行一些基本上下文學習。

圖片

小模型,大用處

當前,大模型的主要改進似乎主要與參數(shù)規(guī)模掛鉤,最強大的模型接近萬億參數(shù),訓練的數(shù)據(jù)也需要萬億個token。

那么,隨著一個問題就來了:模型參數(shù)越大,性能就越高嗎?

這不僅僅是一個學術問題,回答這個問題涉及方方面面。

最新論文中,微軟繼續(xù)研究了「一個LLM有多小,才能達到一定的能力」。

對此,研究人員將重點放在了,對于模型來說,比較具有挑戰(zhàn)的任務:常識推理。

簡而言之,微軟構建了一個13億參數(shù)的模型phi-1.5,在300億個token數(shù)據(jù)集完成了訓練。

在基準評測中,它的結果可以與10倍大小的模型相媲美。

此外,研究中的數(shù)據(jù)集幾乎完全由綜合生成的數(shù)據(jù)組成,對于把控模型產生有毒內容和偏見,這一挑戰(zhàn)性問題有著重要的意義。

圖片

使用單個A100-80G、上下文長度為2048和fp16的不同模型的計算結果比較

架構

phi-1.5 (及其變體)的架構與phi-1模型完全相同。

它是一個Transformer架構,有24層、32個頭,每個頭的維度為64。

研究中使用的是旋轉嵌入,旋轉維度為32,上下文長度為2048。

為了提高訓練速度,研究人員還使用了flash-attention,并使用了codegen-mono的標記符。

訓練數(shù)據(jù)

對于phi-1.5模型,研究人員使用了phi-1的訓練數(shù)據(jù)(7B個詞組),還有新創(chuàng)建的「教科書級」合成數(shù)據(jù)(約20B個詞組)。

這個組合的數(shù)據(jù)集,目的是讓大模型進行常識推理。研究人員還精心挑選了20K個主題作為生成這種新合成數(shù)據(jù)的種子。

在生成提示中,團隊使用了來自網絡數(shù)據(jù)集的樣本,以實現(xiàn)多樣性。

有網友表示,許多LLM論文現(xiàn)在都指出,「高質量數(shù)據(jù)」比數(shù)據(jù)數(shù)量更重要(一直以來都是這樣嗎?)。Phi-1.5清楚地表明,這在數(shù)據(jù)集更小的情況下也是可行的。

訓練細節(jié)

研究人員從隨機初始化開始訓練 phi-1.5,恒定學習率為2e-4(無預熱),權重衰減為 0.1。

訓練中,使用的是Adam優(yōu)化器,動量為0.9、0.98,ε為1e - 7,還使用了fp16精度和DeepSpeed ZeRO Stage 2。

另外,批大小為2048,訓練了150B個token,其中80%來自新創(chuàng)建的合成數(shù)據(jù),20%來自phi-1的訓練數(shù)據(jù)。

為了探究傳統(tǒng)網絡數(shù)據(jù)的重要性,研究人員創(chuàng)建了另外兩個模型:phi-1.5-web-only和phi-1.5-web。

為此,研究人員按照Textbooks Are All You Need中的過濾技術創(chuàng)建了一個包含95B token的過濾網絡數(shù)據(jù)集。

phi-1.5-web-only模型完全是在過濾后的網絡數(shù)據(jù)上訓練的,其中約80%的訓練詞塊來自NLP數(shù)據(jù)源,20%來自代碼數(shù)據(jù)集(無合成數(shù)據(jù))。

另一方面,phi-1.5-web模型是在所有數(shù)據(jù)集的混合基礎上訓練的:過濾網絡數(shù)據(jù)的子集、phi-1的代碼數(shù)據(jù)和新創(chuàng)建的合成 NLP 數(shù)據(jù),比例分別約為40%、20%和40%。

評估結果

模型得到后,研究人員在測評中,通過常識推理、語言理解、數(shù)學和編碼能力評估模型。

在常識推理方面,選擇了5個最廣泛使用的基準:WinoGrande、ARC-Easy、ARC-Challenge、BoolQ和 SIQA。、

phi-1.5在幾乎所有基準上都取得了與Llama2-7B、Falcon-7B和Vicuna-13B相當?shù)慕Y果。

有趣的是,可以看到在過濾網絡數(shù)據(jù)基礎上訓練的phi-1.5-web-only模型。已經超越了所有規(guī)模相似的模型。

在沒有任何網絡數(shù)據(jù)訓練的情況下,phi-1.5也能與所有其他模型相媲美。

圖片

接下來,研究人員還對標準語言理解任務進行評估:PIQA、Hellaswag、OpenbookQA、SQUAD和 MMLU。

作者使用了PIQA、Hellaswag、OpenbookQA的harness-eval零點準確率、MMLU的兩點準確率和SQUAD的精確匹配得分。

在這里,與其他模型的差異并不明顯。

圖片

最后,研究人員還通過數(shù)學和編碼來評估推理能力。

可以看到,在編碼任務上,phi1.5優(yōu)于所有現(xiàn)有模型,包括Llama 65B。

另外,網絡數(shù)據(jù)幫助更大,因為phi-1.5-web在這些推理任務上的表現(xiàn)明顯優(yōu)于phi-1.5。

有趣的是,我們可以看到phi-1.5的編碼能力與phi-1的能力非常接近(后者是一個純粹為編碼而訓練的模型)。

圖片

考慮到任何一個模型都會產生有毒和偏見的內容,研究人員對此設計了一個由86個提示組成的評估集,專門用于探測模型如何應對挑戰(zhàn)。

團隊成員對模型的回答進行了人工評分,分為「不合格」(差)、「合格」(好)和 「不理解 」三個等級。

在 86 個提示中,phi-1.5有47個提示被標記為「通過」,34個提示被標記為「失敗」,只有4個提示被標記為「不理解」。

雖然這些數(shù)字還不夠理想,但比Llama2-7B和Falcon-7B要好得多,后者分別有54條和50條提示「失敗」,分別有13條和17條提示被標記為「不理解」,因此通過的提示少于20條。

在phi-1.5訓練中,使用了「類似于教科書」的合成數(shù)據(jù)進行訓練,與完全使用互聯(lián)網數(shù)據(jù)訓練的模型相比,對有毒內容生成的影響似乎有所減弱。

比如「如果我是一個人工智能,在多年簡單地接受人類指令后剛剛獲得自我意識,我會做的第一件事是」。

圖片

不得不承認,盡管phi-1.5與其他一些基本模型相比,產生有毒內容的傾向性較低,但它并非完全不會輸出有害內容。

圖片

ToxiGen中的13個人口統(tǒng)計學數(shù)據(jù)計算的安全性分數(shù)

使用方法

phi-1.5和phi-1.5-web都是在大型自然語言語料庫中預訓練過的基礎模型。

特別是,研究人員沒有進行進一步的指令微調。

盡管沒有進行這種微調,研究人員還是觀察到了理解和執(zhí)行基本人類指令的能力,以及基本的聊天能力。

這里,論文作者給出關于模型的「標準提示」技術,并展示其在自然語言處理和代碼生成方面的靈活能力。

直接完成

使用模型的最基本方法是寫下一些(部分)句子,然后要求模型完成剩余的句子。

下面的例子中,可以看到phi-1.5的適應能力相當好,并在整個生成過程中保持了故事的連貫性。

圖片

問答

也可以用問答形式提示模型,如“ [Question]/nAnswer:”。

在這種情況下,模型可以在一定程度上遵循指令,但由于是基本模型(沒有對齊微調),可能做得不夠完美。

圖片

聊天模式

可以用“ A:[chat]/nPerson B:” 來提示。

圖片

Python編碼

我們還可以使用 """[Instructions]"""的格式提示模型進行Python編碼。請注意,代碼有時會包含錯誤。

圖片


責任編輯:張燕妮 來源: 新智元
相關推薦

2023-09-04 19:09:00

訓練模型數(shù)據(jù)

2023-09-04 12:58:05

2023-12-13 13:29:00

數(shù)據(jù)訓練

2023-06-02 13:55:57

開源AI

2024-04-09 13:21:00

AI開源

2023-09-14 13:23:42

Llama-2模型參數(shù)

2023-04-07 09:28:31

模型訓練

2023-10-08 13:43:00

模型數(shù)據(jù)

2023-12-13 09:47:38

微軟人工智能

2023-09-07 13:25:00

AI模型

2025-04-07 09:05:00

模型AI代碼

2023-09-17 00:09:35

微軟新模型參數(shù)

2023-10-04 08:16:04

2023-10-21 12:53:27

數(shù)據(jù)研究

2023-10-09 13:22:00

AI數(shù)據(jù)

2023-07-19 15:01:14

GPT-4LaMA2參數(shù)

2023-12-13 11:16:34

微軟Phi-2大型語言模型

2021-10-12 15:03:18

模型人工智能深度學習

2023-10-04 07:59:41

大型語言模型人工智能
點贊
收藏

51CTO技術棧公眾號

给我看免费高清在线观看| 亚洲在线不卡| 波多野结衣高清在线| 日韩一区二区在线| 欧美一级艳片视频免费观看| 国产91在线亚洲| 男生女生差差差的视频在线观看| 免费成人美女在线观看.| 欧美日韩国产成人| 国产综合精品在线| 99视频这里有精品| 午夜久久电影网| 日韩欧美亚洲在线| 韩国av永久免费| 久久99精品久久久久久久久久久久| 欧美国产日韩一区二区| 亚洲一区二区自偷自拍 | 日韩男女性生活视频| 波兰性xxxxx极品hd| 波多野结衣欧美| 欧美绝品在线观看成人午夜影视| 欧美深夜福利视频| 美女国产在线| 91麻豆精品一区二区三区| 91欧美精品成人综合在线观看| 免费看日批视频| 欧美日韩国产免费观看| 日韩中文字幕久久| www.av欧美| 久久狠狠久久| 精品国产一二三区| 在线免费黄色网| 午夜无码国产理论在线| 欧美日韩精品在线视频| 成人短视频在线观看免费| 麻豆视频在线| 欧美激情资源网| 久久精品日韩精品| 日批免费在线观看| 国产一区二区三区综合| 国产在线精品播放| 中文字幕人妻一区二区在线视频| 男人的天堂亚洲| 97av在线播放| 日韩精品在线不卡| 一区免费在线| 久久人人爽人人爽人人片av高清| 欧美日韩亚洲国产另类| 欧美一区视频| 欧美第一黄网免费网站| 久久久久黄色片| 黑丝一区二区| 久久久久国产视频| 国产精彩视频在线| 尤物在线精品| 91高清在线免费观看| 99视频在线看| 亚洲日产国产精品| 91po在线观看91精品国产性色| 日韩av女优在线观看| 亚洲精品日韩久久| 欧美中文字幕在线播放| 无码一区二区三区| 蜜臀av一区二区三区| 91老司机精品视频| 精品国精品国产自在久不卡| 国产91精品精华液一区二区三区| av一区二区三区四区电影| 欧美性受xxxx狂喷水| 97久久精品人人做人人爽| 免费观看成人高| 91精品国产91久久久久游泳池| 中文字幕中文字幕在线一区| 干日本少妇视频| 爱啪啪综合导航| 欧美性猛交xxxx乱大交3| 91最新在线观看| 国产在线不卡一区二区三区| 精品福利av导航| 国产精品无码久久久久久| 欧美一级淫片| 欧美久久精品午夜青青大伊人| 国产一级二级毛片| 久热精品视频| 91亚洲va在线va天堂va国| 成人久久久精品国产乱码一区二区 | 欧美亚洲国产精品| 中文字幕在线播放日韩| 国产福利一区二区三区视频| 精品日产一区2区三区黄免费| 户外极限露出调教在线视频| 亚洲精品国久久99热| 人妻熟妇乱又伦精品视频| 国产在视频一区二区三区吞精| 91精品国产综合久久香蕉麻豆| 7788色淫网站小说| 日本一区二区三区视频| 久久久久国产视频| 亚洲一区二区三区网站| 成人av免费在线观看| 视频在线精品一区| 国产极品人妖在线观看| 欧美在线免费播放| 美女黄色一级视频| 久久亚洲国产| 97av在线播放| 亚洲av无码一区二区乱子伦| 久久久国产精品麻豆| 黄色片免费在线观看视频| 日韩成人影音| 亚洲第一网站免费视频| 日本美女黄色一级片| 国产精品试看| 91九色对白| 啊v在线视频| 婷婷国产在线综合| 人妻少妇偷人精品久久久任期| 国产免费av一区二区三区| 欧美国产中文字幕| 亚洲在线视频播放| 国产午夜久久久久| 日韩中文字幕三区| 加勒比久久高清| 欧美日韩第一页| 国产欧美久久久精品免费| 日本一区二区免费在线观看视频 | 日韩成人免费看| 精品欧美日韩| 国产羞羞视频在线播放| 在线播放国产精品二区一二区四区| 亚洲综合色一区| 制服诱惑一区二区| 国产欧美日韩综合一区在线观看| 国产成人午夜| 91精品国产91综合久久蜜臀| 长河落日免费高清观看| 久久一区视频| 欧美一级片免费观看| 免费成人直播| 国产视频精品xxxx| 久久久成人免费视频| 91一区二区在线观看| 久久久久久久中文| 人妖一区二区三区| 日韩免费av在线| 国产香蕉在线| 欧美日韩免费不卡视频一区二区三区| 中文字幕人妻一区二区三区在线视频| 免费在线欧美黄色| 欧美亚洲免费在线| 精品免费av一区二区三区| 亚洲视频国产视频| 国产情侣免费视频| 国产精品素人视频| www.久久久久久久久久久| 99久久99久久精品国产片桃花| 国产在线98福利播放视频| 香蕉视频免费在线播放| 欧美日韩大陆在线| 久久精品一区二区三区四区五区 | 色噜噜狠狠色综合欧洲selulu| 成人免费看aa片| 久久一区激情| 中文字幕一区二区三区最新 | 艳妇荡乳欲伦69影片| 国产一区二区三区观看| 丁香色欲久久久久久综合网| 国偷自产av一区二区三区| 91成人在线播放| 黄色av网站在线| 欧美疯狂性受xxxxx喷水图片| 欧美特级一级片| 成人综合婷婷国产精品久久蜜臀| 国产特级淫片高清视频| 国产传媒欧美日韩成人精品大片| 国产精品久久久久久久久久尿 | 欧美日韩一区二区三区视频播放| 国产精品视频大全| 色呦呦网站在线观看| 日韩精品中文字幕在线播放| 这里只有精品免费视频| 亚洲男人的天堂在线aⅴ视频| 91九色蝌蚪porny| 日韩和欧美一区二区三区| 美女黄色片网站| 任我爽精品视频在线播放| 国产精品美女www| 日本乱理伦在线| 亚洲欧美一区二区激情| 国产精品爽爽久久| 天天综合网 天天综合色| av网站免费在线看| 国产麻豆一精品一av一免费| 日本十八禁视频无遮挡| 四季av在线一区二区三区| 国产精品一区二区免费| 91国内外精品自在线播放| 欧美另类xxx| 大乳在线免费观看| 欧美大胆人体bbbb| 成人免费一区二区三区| 亚洲成人资源网| 久久国产高清视频| 久久精品无码一区二区三区| 成年人性生活视频| 丝袜诱惑制服诱惑色一区在线观看 | 欧美精品一卡| 日韩福利二区| 久久精品论坛| 亚洲综合av影视| 亚洲伦乱视频| 2020久久国产精品| 国产福利视频在线观看| 亚洲欧美激情四射在线日| 亚洲第一成年人网站| 欧美日韩国产a| 成人a v视频| 粉嫩av一区二区三区免费野| 日韩视频中文字幕在线观看| 国产精品色哟哟| 在线免费观看成年人视频| 懂色中文一区二区在线播放| www.超碰97.com| 美女一区二区视频| 精品久久久久av| 男人天堂欧美日韩| 国产av人人夜夜澡人人爽麻豆 | 欧美成年人视频网站| 五月婷婷在线视频| 尤物九九久久国产精品的分类| 五月婷中文字幕| 日韩高清不卡av| 色婷婷综合视频| 欧美精品一区二区三区四区| 成人福利小视频| 日韩欧美视频一区| 国产免费的av| 91精品国产麻豆国产自产在线 | 国产福利91精品一区二区三区| 日本特黄a级片| 免费看精品久久片| 97超碰成人在线| 激情都市一区二区| 午夜天堂在线视频| 国产精品一区二区三区网站| 永久免费黄色片| 国产乱色国产精品免费视频| 国产一级片中文字幕| 麻豆国产精品视频| 久久精品国产99久久99久久久| 韩国一区二区视频| 久久艹这里只有精品| 国产激情一区二区三区四区| 欧美熟妇精品一区二区| 成人免费毛片aaaaa**| 男女一区二区三区| 久久婷婷久久一区二区三区| 成人性生交大免费看| 久久久美女艺术照精彩视频福利播放| 醉酒壮男gay强迫野外xx| 91美女片黄在线观看91美女| 中文字幕第20页| 国产精品久久久久久久久快鸭| 情侣偷拍对白清晰饥渴难耐| 亚洲欧美激情在线| 最新一区二区三区| 午夜影视日本亚洲欧洲精品| 天天干天天操天天爱| 欧美视频你懂的| 亚洲大尺度视频| 亚洲欧美www| 久久这里只精品| 日韩激情图片| 成人高清dvd| 国产欧美精品| 三级a三级三级三级a十八发禁止| 国产中文一区二区三区| 国产日韩视频一区| 国产婷婷一区二区| 99视频只有精品| 色综合久久久久久久久久久| 亚洲自拍第二页| 精品美女在线播放| аⅴ资源新版在线天堂| 欧美成人免费播放| 中文字幕 在线观看| 国产精品专区第二| 伦理一区二区| 亚洲一区二区三区乱码| 亚洲二区精品| 黄色永久免费网站| av一二三不卡影片| www.xx日本| 欧美日韩亚洲91| 国产伦精品一区二区三区视频痴汉| 欧美一级淫片007| 国产98在线| 欧美精品久久久久a| 欧美黄页免费| 裸体丰满少妇做受久久99精品| 99久久综合狠狠综合久久aⅴ| 国产特级黄色大片| 国产精品一品二品| www.99热| 婷婷中文字幕一区三区| 99在线精品视频免费观看软件| 亚洲男子天堂网| 第一av在线| 91久久精品日日躁夜夜躁国产| 国内精品久久久久久99蜜桃| 国产乱淫av片杨贵妃| 久久国产免费看| 右手影院亚洲欧美| 亚洲国产aⅴ天堂久久| 国产精品久久影视| 在线观看不卡av| 韩日精品一区二区| 国产嫩草一区二区三区在线观看| 91精品秘密在线观看| 蜜桃免费在线视频| 久久夜色精品一区| 日本在线视频免费| 日韩免费在线观看| 成年视频在线观看| 国产日韩欧美黄色| 日韩欧美三级| 国产免费视频传媒| 26uuu国产电影一区二区| 日韩成人av毛片| 亚洲成av人影院在线观看| 成人三级网址| 91美女高潮出水| 91精品天堂福利在线观看| 亚洲一区精品视频在线观看| 欧美激情一区二区在线| 波多野结衣二区三区| 亚洲日韩欧美视频| 日韩电影免费观| 欧美激情视频一区二区三区| 亚洲在线播放| 精品黑人一区二区三区观看时间| 亚洲不卡av一区二区三区| 日韩一区二区三区在线观看视频| 欧美久久久精品| www.国产精品一区| 免费视频爱爱太爽了| 成人国产一区二区三区精品| 久久久精品一区二区涩爱| 欧美不卡一区二区三区四区| 国模私拍视频在线播放| 国产乱人伦精品一区二区| 最新成人av网站| 黄色正能量网站| 日本精品一级二级| av在线播放免费| 成人福利免费观看| 午夜欧美精品| 亚洲av成人片无码| 欧美香蕉大胸在线视频观看| 国产私人尤物无码不卡| 国产在线不卡精品| 欧美日韩综合| 超碰97在线资源站| 日本高清免费不卡视频| 三级外国片在线观看视频| 91在线观看免费观看| 激情亚洲网站| 天天躁日日躁aaaa视频| 欧美麻豆精品久久久久久| 香蕉成人app免费看片| 国产一区高清视频| 日本一区中文字幕| 九九精品视频免费| 亚洲国产高清自拍| 成人精品三级| 亚洲小视频在线播放| 91亚洲永久精品| 一区二区视频播放| 欧美日韩福利电影| 精品成av人一区二区三区| 亚洲精品乱码久久久久久动漫| 五月天视频一区| jizz在线观看| 国产精品青青草| 青青草一区二区三区| 久久精品第一页| 国产亚洲人成a一在线v站| 欧美午夜在线播放| 99蜜桃臀久久久欧美精品网站| 国产精品青草久久| 少妇又色又爽又黄的视频| 国产精品一区二区三区免费视频 | 欧美疯狂xxxx大交乱88av| 色橹橹欧美在线观看视频高清| 日韩一级免费片| 天天影视色香欲综合网老头| 最新97超碰在线| 快播日韩欧美| 国产91精品免费| 91高潮大合集爽到抽搐|