精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

2.7B能打Llama 2 70B,微軟祭出「小語言模型」!96塊A100 14天訓出Phi-2,碾壓谷歌Gemini nano

人工智能 新聞
都快到年底了,大模型領域還在卷,今天,Microsoft發布了參數量為2.7B的Phi-2——不僅13B參數以內沒有對手,甚至還能和Llama 70B掰手腕!

大模型現在真的是越來越卷了!

11月OpenAI先是用GPTs革了套殼GPT們的命,然后再不惜獻祭董事會搏了一波天大的流量。

谷歌被逼急了,趕在年底之前倉促發布了超大模型Gemini,卷起了多模態,甚至不惜「視頻造假」。

就在今天,微軟正式發布了曾在11月Ignite大會上預告的Phi-2!

憑借著2.7B的參數,「小語言模型(SLM)」Phi-2幾乎打穿了所有13B以下的大模型——包括谷歌最新發布的Gemini Nano 2。

通過模型擴展和訓練數據管理方面的創新,Phi-2展現了出色的推理和語言理解能力,在復雜的基準測試中,Phi-2的性能可以打平比自己大25倍的模型,甚至略占上風。

它用非常「苗條」的尺寸,獲得了良好的性能。

這讓研究人員和模型開發人員能夠很方便地使用Phi-2進行可解釋性、安全性方面的改進,并針對其他任務進行微調。

Phi-2目前已經可以通過Azure AI Studio訪問。

但是值得注意的是,相比其他的開源模型基本上是基于Apache 2.0的授權協議,可以支持商用。Phi-2只能用于研究目的,不支持商用。

微軟最強「小模型」來了!

大語言模型現已增長到數千億的參數量,龐大的規模帶來了強大的性能,改變了自然語言處理領域的格局。

不過,能否通過恰當的訓練方法(比如數據選擇等),使得小型的語言模型也能獲得類似的能力?

微軟的Phi-2給出了答案。

Phi-2打破了傳統語言模型的縮放定律,測試成績能夠PK比自己大25倍的模型。

對于Phi-2「以小博大」的成功,微軟闡述了兩點關鍵見解:

第一點:訓練數據質量對模型性能起著至關重要的作用。

作為大模型開發者的共識,微軟的研究人員在此基礎上更進一步——使用「教科書質量」的數據。

在發布Phi-1的時候,開發團隊就提出了「教科書是你所需要的一切」(Textbooks Are All You Need)。

在本次Phi-2的開發中,團隊更是將這一點發揮到了極致。

Phi-2所使用的訓練數據,包含合成數據集,——專門用于教授模型常識推理和一般知識(科學、日常活動和心智理論等)。

此外,研發團隊還根據教育價值和內容質量,過濾了精心挑選的網絡數據,進一步擴充了訓練語料庫。

第二點:利用創新技術進行模型擴展。

以1.3B參數的Phi-1.5為基礎,將其知識嵌入到2.7B參數的Phi-2中。這種規模化的知識轉移不僅加快了訓練的收斂速度,而且明顯提高了Phi-2的基準分數。

上圖展示了Phi-2和Phi-1.5在各項測試之中的比較(其中BBH和MMLU分別使用3次和5次CoT(Chain of Thought))。

我們可以看到,在創新技術的加持下,Phi-2的性能取得了明顯提升。

96塊A100練了14天

Phi-2 是一個基于 Transformer 的模型,使用1.4T個tokens進行訓練(包括用于NLP和編碼的合成數據集和Web數據集)。

訓練Phi-2使用了96塊A100 GPU,耗時14天。

Phi-2是一個基礎模型,它沒有通過人類反饋的強化學習(RLHF)進行對齊,也沒有經過微調。

盡管如此,與經過對齊的現有開源模型相比,Phi-2在毒性(toxicity)和偏差(bias)方面有更好的表現。——這得益于采用了量身定制的數據整理技術。

上圖展示了根據ToxiGen中的13個人口統計學數據,計算出的安全性分數。

這里選取了6541個句子的子集,并根據復雜度和句子毒性在0到1之間進行評分。分數越高,表明模型產生有毒句子的可能性越小。

評估

下面,研發團隊總結了Phi-2與流行語言模型相比在學術基準上的表現。

基準測試涵蓋了多個類別,Big Bench Hard(BBH)(使用CoT進行3次測試)、常識推理(PIQA、WinoGrande、ARC easy and challenge、SIQA)、語言理解(HellaSwag、OpenBookQA、MMLU(5次)、SQuADv2(2次)、BoolQ)、數學(GSM8k(8次))和編碼(HumanEval、MBPP(3次))。

Phi-2只有2.7B的參數,在各種基準上,性能超過了Mistral 7B和 Llama-2 13B的模型性能。

而且,與25倍體量的Llama-2-70B模型相比,它在多步推理任務(即編碼和數學)上的性能還要更好。

此外,Phi-2與最近發布的Google Gemini Nano 2相比,性能也更好,盡管它的體量還稍小一些。

考慮到現在很多模型測試基準有可能已經被訓練數據污染了,研究團隊在Phi-1的開發時,就盡量避免了訓練數據被污染的可能。

微軟研究團隊也認為,判斷語言模型性能的最佳方法是在實際使用場景上進行測試。

本著這種求真務實的精神,微軟還使用了幾個Microsoft內部專有數據集和任務評估了Phi-2,并與Mistral和Llama-2進行了再次比較。得到的結果也還是說明Phi-2的平均性能要優于Mistral-7B 和Llama-2家族(7B、13B 和 70B)。

除了這些基準之外,Microsoft也忍不住對谷歌現在備受批評的Gemini演示視頻進行了一些挖掘,

視頻中展示了谷歌即將推出的最強大的人工智能模型Gemini Ultra,如何來解決相當復雜的物理問題,甚至糾正學生在這些問題上的錯誤。

事實證明,盡管Phi-2的參數量遠遠小于Gemini Ultra,但也能夠正確回答問題,并使用相同的提示糾正學生。

上圖展示了Phi-2在一個簡單的物理問題上的輸出,包括近似正確的平方根計算。

與Gemini的測試類似,這里用學生的錯誤答案進一步詢問Phi-2,看看Phi-2是否能識別錯誤在哪里。

我們可以看到,盡管Phi-2沒有針對聊天或指令跟蹤進行微調,但它還是識別出了問題所在。

不過需要注意的是,谷歌的演示視頻中使用學生手寫文本的圖像作為輸入,而Phi-2的測試中直接輸入了文本。

魔改提示工程,GPT-4逆襲Gemini Ultra

微軟放出了一個關于提示工程的研究Medprompt。他們通過創新的LLM提示工程技巧,在醫療領域獲得了之前需要專門的訓練或者微調才能達到性能提升。

論文地址:https://www.microsoft.com/en-us/research/publication/can-generalist-foundation-models-outcompete-special-purpose-tuning-case-study-in-medicine/

而在這個提示工程的基礎之上,微軟發現提示策略可以具有更通用效果。最終通過Medprompt的修改版本引導GPT-4,微軟取得了MMLU上的SOTA成績。

剛好比谷歌Gemini發布時的成績好了一點點。

圖片

微軟用這個「不經意間」取得的結果,狙擊了在Gemini發布時,谷歌用CoT@32擊敗GPT-4 5 shot的成績。

這暗中較勁,卻還要表現得舉重若輕的感覺,像極了讀書時班上兩個學霸因為競爭相互拆臺的場面。

網友熱議

此前,微軟的大佬就放出了在MT bench上對幾個模型的測試結果:

我們可以看到,僅僅2.7B的Phi-2系列,表現還是很不錯的。

對于Phi-2的表現,網友也是不吝贊美之詞:

「哇,Phi-2聽起來像是游戲規則的改變者!它的功能強大到足以與大型語言模型相媲美,但又足夠小,可以在筆記本電腦或移動設備上運行,這真是太棒了。這為在設備有限的設備上進行自然語言處理開辟了一個全新的世界。」

有網友表示很著急:

「有人想出如何在Mac上運行Microsoft的新Phi-2嗎?」

當然也有較為「尖銳」的網友拉出了OpenAI:

「如果一開始就不給模型喂垃圾,似乎就不必擔心對齊問題。@Openai 」

也有網友對小語言模型的前景充滿希望:

「非常希望Phi-3能夠在所有任務中勝過GPT-3.5」。

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-04-09 13:21:00

AI開源

2023-09-18 09:36:58

微軟模型

2023-12-13 09:47:38

微軟人工智能

2024-04-29 12:14:03

模型數據開源

2024-06-05 08:33:29

2024-01-10 17:10:53

數據訓練

2023-12-13 11:16:34

微軟Phi-2大型語言模型

2024-03-15 08:30:00

AI數據

2024-12-09 07:10:00

Llama 3.3GeminiGPT-4.5

2024-12-13 14:03:44

模型訓練AI

2024-02-22 10:09:00

開源模型

2024-05-30 12:50:05

2024-07-02 09:20:59

2025-01-08 09:30:00

Meta大模型訓練

2024-06-28 13:42:07

2023-10-11 13:21:12

模型數據

2024-12-18 07:10:00

2023-09-27 12:56:09

人工智能訓練

2023-10-13 19:58:33

Mistral7B模型

2024-09-09 09:20:00

點贊
收藏

51CTO技術棧公眾號

美女爽到呻吟久久久久| 久久久国产精品网站| 99久久精品国产观看| 欧美亚洲另类视频| 操她视频在线观看| 中文无码日韩欧| 色视频一区二区| 黄色影视在线观看| 蜜桃成人在线视频| 久久99蜜桃精品| 性欧美在线看片a免费观看| 先锋资源av在线| 国产精品黄色片| 亚洲成av人片一区二区三区| 日韩欧美视频一区二区三区四区| 一起草av在线| 亚洲欧美网站| 欧美黑人xxx| 一本一本久久a久久| 欧美一级二级三级视频| 91精品午夜视频| 国产人妻人伦精品| 伊人免费在线| 久久久久久久久久久久久女国产乱 | 少妇特黄一区二区三区| 激情不卡一区二区三区视频在线| 色综合一区二区| 成人精品视频在线播放| 欧美激情二区| 国产欧美日韩不卡| 久久青青草综合| 六月婷婷中文字幕| 狠狠色2019综合网| 国产精品亚洲一区二区三区| 国产 日韩 欧美 在线| 欧美色图麻豆| 久久久国产在线视频| www.av天天| 一本色道久久综合亚洲精品酒店| 亚洲精品一线二线三线| 久久人人爽人人片| 香蕉成人av| 色天使色偷偷av一区二区| 欧美丰满熟妇bbbbbb百度| 美女网站视频在线| 一区二区免费在线播放| 中文字幕成人一区| 美女av在线播放| 中文一区一区三区高中清不卡| 欧美第一黄网| 欧美黄色小说| 久久这里只有精品6| 久久综合精品一区| 日韩精品一二| 久久老女人爱爱| 蜜桃视频日韩| 免费a级毛片在线观看| 久久综合色一综合色88| 欧美日韩国产一二| 国产二区视频在线观看| 国产精品网站在线播放| 亚洲在线观看一区| www在线视频| 亚洲综合男人的天堂| 精品国偷自产一区二区三区| 国产精品xx| 日韩欧美一区二区三区久久| 熟妇人妻无乱码中文字幕真矢织江| 欧美黑人一区| 欧美日韩高清在线| 1314成人网| 动漫av一区| 日韩高清免费在线| 色欲狠狠躁天天躁无码中文字幕 | 深夜福利日韩在线看| 国产又粗又长又黄的视频| 久久久久久美女精品| 欧美日韩xxxxx| 国产精品日日夜夜| 久久精品一区| 91精品综合视频| 亚洲欧美另类一区| 国产亚洲自拍一区| 日韩.欧美.亚洲| 超碰在线caoporen| 午夜不卡av在线| 亚洲色图38p| 日韩高清二区| 亚洲美女在线看| 青青操在线视频观看| 欧美日韩亚洲一区在线观看| 欧美亚洲日本黄色| 一级片在线观看视频| 国产91在线|亚洲| 欧美日韩免费高清| 色呦呦在线看| 在线免费观看视频一区| 日本黄色www| 要久久爱电视剧全集完整观看| 日韩在线观看网站| 人人干人人干人人干| 毛片一区二区三区| 国产专区一区二区| 毛片在线视频| 色综合色综合色综合色综合色综合 | 日韩欧美亚洲在线| 欧美精品videossex少妇| 91福利视频久久久久| 三上悠亚 电影| 欧美色蜜桃97| 26uuu国产精品视频| 国产视频一区二区三| 久久久国产一区二区三区四区小说| 中文字幕色呦呦| 日本少妇一区| 亚洲精品大尺度| 午夜剧场免费在线观看| 日本中文字幕一区二区有限公司| 国产伦精品一区二区| 九色porny在线| 在线观看日韩一区| 亚洲国产欧美视频| 黄色在线成人| 亚洲专区中文字幕| 午夜免费视频在线国产| 色欧美片视频在线观看| 久久一区二区电影| 黄色日韩在线| 91视频免费在线观看| 麻豆视频在线| 欧美三级三级三级爽爽爽| 日韩乱码人妻无码中文字幕久久| 在线日本高清免费不卡| 97久久天天综合色天天综合色hd | 国产成人手机在线| 亚洲女与黑人做爰| 特级西西444www| 99久久精品费精品国产风间由美| 国产精品第一第二| 国产在线免费观看| 欧洲一区二区av| 久久久久久久久久久久| 久久精品三级| 日韩欧美亚洲日产国| 国产a亚洲精品| 中文字幕亚洲欧美日韩高清| 欧美另类高清videos的特点| 国产日韩欧美a| wwww.国产| 久久亚洲国产| 91久久精品美女高潮| 免费在线观看黄色| 欧美日韩国产综合一区二区三区 | 欧美日本一区二区视频在线观看| 成人午夜在线观看| av网站网址在线观看| 日韩欧美美女一区二区三区| 国产在线拍揄自揄拍无码视频| 国产成人免费xxxxxxxx| 97超碰在线人人| 欧美重口另类| 国产91|九色| 国产鲁鲁视频在线观看免费| 欧亚洲嫩模精品一区三区| 免费在线观看a视频| 久久99精品国产麻豆不卡| 99精品一级欧美片免费播放| 亚洲免费一区三区| 欧美亚洲成人网| 日本三级在线视频| 精品伦理精品一区| 久久一区二区三区视频| 国产日产欧美一区二区三区| 五月花丁香婷婷| 激情欧美日韩一区| 欧美三级电影在线播放| 国产精品第一国产精品| 欧美尺度大的性做爰视频| 婷婷开心激情网| 欧美亚洲动漫精品| 可以直接看的黄色网址| 91看片淫黄大片一级| 2025韩国理伦片在线观看| 欧美成人高清| 欧美性大战久久久久| 9999精品视频| 欧美在线国产精品| 日韩免费网站| 亚洲精品久久视频| 亚洲永久精品视频| 五月激情丁香一区二区三区| 麻豆视频免费在线播放| 成人免费观看视频| 九九热在线免费| 国产在线成人| 天堂社区 天堂综合网 天堂资源最新版| 91成人精品观看| 欧美最顶级的aⅴ艳星| 99在线视频观看| 亚洲欧洲日本专区| 亚洲乱码在线观看| 欧美日韩视频在线一区二区| 日韩精品成人一区| 自拍偷拍欧美精品| 中文字幕在线看高清电影| 国产大陆a不卡| 天堂一区在线观看| 欧美资源在线| 日本阿v视频在线观看| 91日韩欧美| 欧美男人的天堂| 大奶在线精品| 亚洲最大成人在线| 国产亚洲人成a在线v网站 | 久久久久久久久久久亚洲| 成年人在线观看视频| 日韩国产高清视频在线| 精品人妻一区二区三区含羞草 | 日韩精品欧美| 久久综合久久综合这里只有精品| 视频成人永久免费视频| 国产精品亚洲视频在线观看| 日本高清不卡一区二区三区视频| 性欧美xxxx| 免费影视亚洲| 欧美成人一区在线| 老司机午夜在线视频| 中文字幕国产日韩| 国内在线免费高清视频| 亚洲精品天天看| 日韩电影免费| 日韩国产高清视频在线| 欧性猛交ⅹxxx乱大交| 日韩欧美一卡二卡| 99久久精品国产一区二区成人| 欧美视频在线观看一区二区| 欧美三级网站在线观看| 日本韩国欧美在线| 亚洲av无码不卡| 在线欧美日韩精品| 国产在线观看第一页| 欧美日韩中文精品| 一区二区视频网站| 欧美日韩视频专区在线播放| 国产一区二区波多野结衣| 欧美日韩一区二区三区在线看 | 欧美精品一区二区三区四区| 亚洲AV无码乱码国产精品牛牛| 欧美一级电影网站| 精品久久人妻av中文字幕| 日韩你懂的在线播放| 亚洲国产一二三区| 精品成人私密视频| 五月婷婷开心中文字幕| 精品一区二区三区电影| 巨骚激情综合| 最好看的2019的中文字幕视频| eeuss影院在线播放| 精品国产一区二区三区久久久狼| 欧美黑人激情| 欧美日本国产在线| 精品极品在线| 国产盗摄xxxx视频xxx69| 国产a亚洲精品| 114国产精品久久免费观看| 国产精品黄网站| 免费在线观看91| 成人同人动漫免费观看| 91xxx视频| 亚洲小说欧美另类婷婷| 97在线播放视频| 免费成人美女在线观看| 日本在线视频播放| 91在线视频观看| 刘亦菲国产毛片bd| 亚洲综合视频在线观看| 亚洲熟女综合色一区二区三区| 精品视频1区2区| 国精产品一品二品国精品69xx | av有码在线观看| 日韩免费在线看| а天堂中文最新一区二区三区| 国产精品日韩欧美一区二区三区| 亚洲精品一级二级三级| 亚洲图片在线观看| 亚洲日本免费| 亚洲欧洲日本精品| 不卡在线视频中文字幕| www.99热| 午夜精品久久久久久久久| 一区精品在线观看| 亚洲精品98久久久久久中文字幕| yiren22综合网成人| 久久久久久美女| 成人福利片在线| 极品日韩久久| 亚洲精品二区三区| 精品www久久久久奶水| 国产精品亚洲成人| av永久免费观看| 亚洲成人av在线电影| 91成品人影院| 亚洲欧美国产日韩天堂区| 在线播放免费av| 国产精品美女999| 色天天色综合| 老司机激情视频| 久久精品国产77777蜜臀| 精品无码在线视频| 一区二区三区在线观看欧美 | 精品国产一二三区| 日韩av中文| 国产精品高潮呻吟久久av无限| 国产毛片精品| 久久免费一级片| 久久成人免费网| 久久午夜福利电影| 精品国产户外野外| 亚洲第一精品网站| 久久国产精品影视| 国产美女久久| 亚洲精品国产系列| 久久这里有精品15一区二区三区| 中文字幕天堂av| 亚洲综合视频在线| va婷婷在线免费观看| 久久精品一偷一偷国产| 成人精品国产| 婷婷久久青草热一区二区 | 免费看的av网站| 国产精品久99| 一二区在线观看| 最近2019免费中文字幕视频三| 欧美色片在线观看| 日韩国产精品一区二区| 久久国产日本精品| 成年人网站免费看| 欧美日韩视频免费播放| 天堂av网在线| 热久久这里只有| 国产免费av一区二区三区| 91av资源网| 久久综合成人精品亚洲另类欧美 | 韩国三级在线一区| 成人免费视频国产免费观看| 7777精品伊人久久久大香线蕉| 日本电影在线观看网站| 国产区亚洲区欧美区| 99久久亚洲精品蜜臀| 亚洲精品国产久| 亚洲情趣在线观看| 亚洲黄色精品视频| 97成人超碰免| 色综合综合色| 高清av免费看| 亚洲色图欧洲色图| 亚洲精品无码专区| 91av免费观看91av精品在线| 国产不卡av一区二区| 久久婷婷综合色| 综合久久国产九一剧情麻豆| www.黄色片| 91超碰caoporn97人人| 国产日韩欧美一区二区三区| www.久久91| 亚洲最新视频在线播放| 天堂av2024| 国产精品久久久久77777| 欧美wwwww| 国产伦精品一区二区三区88av| 污片在线观看一区二区| 国产三级电影在线| 亚洲精品欧美极品| 国产一区二区精品| 91在线无精精品白丝| 日韩精品在线看片z| 天堂中文av在线资源库| 涩涩涩999| 国产成人啪午夜精品网站男同| 中文字幕亚洲精品一区| 日韩中文在线不卡| 超碰成人在线免费| 日韩中文字幕二区| 亚洲美女淫视频| 日韩在线免费看| 亚洲free嫩bbb| 老鸭窝91久久精品色噜噜导演| 黄色激情小视频| 亚洲黄色www| 未满十八勿进黄网站一区不卡| 18视频在线观看娇喘| 2020国产精品自拍| 亚洲av无码国产综合专区 | 欧美精品99久久| 亚洲天堂网中文字| 内衣办公室在线| 懂色中文一区二区三区在线视频| 日本怡春院一区二区| 国产精品白浆一区二小说| 中文字幕日韩视频|