精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

推理成本驟降75%!gpt-oss用新數據類型實現4倍推理速度,80GB顯卡能跑1200億參數大模型

人工智能 新聞
MXFP4在把內存占用降為同規模BF16模型的四分之一的同時,還把生成token的速度提升了整整4倍。

OpenAI在最新的開源模型gpt-oss上采用的MXFP4數據類型,直接讓推理成本暴降75%!

更驚人的是,MXFP4在把內存占用降為同規模BF16模型的四分之一的同時,還把生成token的速度提升了整整4倍。

換句話說,這一操作直接把1200億參數的大模型塞進80GB顯存的顯卡,哪怕是只有16GB顯存的顯卡也能跑200億參數的版本。

圖片

(注:顯存容量通常會大于Checkpoint Size)

相比以往的數據類型,MXFP4提供了極高的性價比,模型運行所需的硬件資源僅為之前的四分之一。

MXFP4有什么魔力?

在gpt-oss中,OpenAI將MXFP4量化應用于大約90%的權重,這一操作的直接動機(收益)就是讓模型運行成本變得更加便宜。

將gpt-oss模型量化為MXFP4 后,大語言模型的占用內存僅為等規模BF16模型的1/4,而且生成token的速度最高可提升4倍。

圖片

如何通過改變數據類型降低模型運行成本?這里的邏輯是這樣的:

模型的運行成本主要由權重存儲內存帶寬兩個部分組成。

前者是模型參數存放和占用的空間,也就是存儲它們所需要的字節數。

后者則是模型在推理時,數據讀寫速度和容量的限制。

數據類型的變化將直接影響權重存儲和內存帶寬的占用。

例如,傳統模型權重通常用FP32(32位浮點數)存儲,每個參數占用4字節內存。

如果用MXFP4,那么每個權重只有半字節權重存儲大小是FP32的1/8,這就極大地壓縮了權重數據量的大小。

這一壓縮不僅降低了模型的存儲空間,還能讓模型在同樣的帶寬下完成更快地數據讀取和寫入,從而提高推理速度。

由此,通過改變數據類型就能實現推理成本的降本增效。

那么,MXFP4是怎么實現這一點的?

MXFP4

MXFP4的全稱是微縮放4位浮點數(Micro-scaling Floating Point 4-bit),是由Open Compute Project (OCP) 定義的4位浮點數據類型。

(注:OCP是Facebook于2011年發起的超大規模數據中心合作組織,旨在降低數據中心組件成本并提高可獲取性。)

在深度學習領域中,數據類型的精度和效率一直是研究者取舍的重點。

例如,傳統的FP4只有四位,1位符號位(表示正負),2位指數位(決定數值的量級),1位尾數位(表示小數部分)。

這種表示方法雖然壓縮了數據量,但也導致了非常有限的可表示的數值范圍,它只能表示8個正數和8個負數。

相較之下,BF16(1位符號位,8位指數位和7 位尾數位)則能表示 65,536個數值,不過表示范圍的增加也帶來了計算成本的上升。

如果為了提高計算效率,直接把這4個BF16數值:0.0625、0.375、0.078125、0.25直接轉換成FP4,那么它們會變成 0、0.5、0、0.5。

不難看出,這樣的誤差顯然是無法接受的。

于是,為了在減少數據量的同時確保一定的精度,MXFP4通過將一組高精度數值(默認32個)乘以一個公共縮放因子(這個縮放因子是一個8位二進制指數)。這樣,我們前面那4個BF16數值就會變成 1、6、1.5、4。

圖片

這樣就既實現了極致的數據大小,又維持了數值間大小關系的精度。

此外,這一過程的實現還與計算硬件相關

一般規律是,每將浮點精度減半,芯片的浮點吞吐量就能翻倍。

比如,一個B200SXM模塊的稠密BF16運算性能約為2.2 petaFLOPS,降到FP4(Nvidia Blackwell 芯片提供硬件加速)后,就能提升到9petaFLOPS

雖然這會在吞吐量上帶來一些提升,但在推理階段,更多FLOPS的意義主要是減少模型開始生成答案的等待時間

值得注意的是,運行MXFP4模型并不要求硬件必須原生支持FP4

用于訓練gpt-oss的Nvidia H100就不支持原生FP4,不過它依然可以運行,只是無法享受該數據類型的全部優勢。

低精度與計算量的取舍

事實上,MXFP4并不是新概念。早在2023年的報告中,OCP就在報告《OCP Microscaling Formats (MX) Specification Version 1.0》中詳細介紹過這一數據類型。

圖片

然而,這種低精度的數據類型通常被認為是對性價比的妥協,因為精度下降會導致質量損失。損失的程度取決于具體的量化方法。

不過,已經有足夠多的研究表明,將數據精度從16位降到8位,在大語言模型場景下幾乎沒有質量損失,這種精度已經足夠支撐模型的正常工作。

事實上,一些模型開發者,例如DeepSeek已經開始直接用FP8進行訓練。

此外,雖然MXFP4比標準FP4好得多,但它也有缺陷

例如,英偉達就認為這種數據類型相比FP8仍可能出現質量下降,部分原因是其縮放塊大小(Scaling Block Size)為32,不夠細粒化。

為此,英偉達推出了自己的微縮放數據類型NVFP4,通過將縮放塊大小降至16和使用FP8縮放因子來提高質量。

這幾乎等同于FP8的工作方式。只不過MXFP4是在張量內部的小塊上應用縮放因子,而不是作用于整個張量,從而在數值之間實現更細的粒度。

最后,在gpt-oss上,OpenAI只使用了MXFP4。

鑒于OpenAI在AI領域上的影響力,這基本上就等于在說:

如果MXFP4對我們夠用,那對你也應該夠用。

責任編輯:張燕妮 來源: 量子位
相關推薦

2023-05-15 15:38:59

AI模型

2025-08-07 14:05:40

OpenAI大模型開源

2025-08-08 04:11:00

GPT-OSS大模型算法

2025-03-14 11:56:52

2024-07-19 09:26:12

2024-07-08 13:04:01

2024-07-19 09:59:31

2024-02-01 12:43:16

模型數據

2025-06-11 14:39:50

AILLMMistral

2025-02-19 15:17:24

2025-02-12 09:20:12

2023-01-18 09:51:56

模型開源

2025-08-18 09:15:00

2024-01-24 13:11:00

AI模型

2025-01-08 13:15:02

2024-01-26 13:18:00

AI訓練

2025-10-06 01:00:00

DeepSeekV3.2-Exp

2025-04-16 09:46:46

點贊
收藏

51CTO技術棧公眾號

亚洲精品欧美综合四区| 视频一区视频二区在线观看| 日韩一级黄色片| 欧美一级片免费播放| 少妇又色又爽又黄的视频| 久久一区二区三区四区五区| 啊v视频在线一区二区三区| 樱花草www在线| 超碰在线视屏| 中文字幕在线一区| 国产精品视频500部| av图片在线观看| 午夜精品久久久久久久四虎美女版| 日韩亚洲电影在线| 成人免费毛片播放| 色呦呦在线免费观看| 久久精品一区二区三区四区| 亚洲伊人久久综合| 国产伦精品一区二区三区视频我| 91精品综合| 亚洲欧美国产日韩中文字幕| 伊人成人免费视频| 日韩欧美一区二区三区在线观看 | 一区二区免费在线观看视频| 成人教育av| 亚洲制服欧美中文字幕中文字幕| 日韩国产精品一区二区三区| 丰满人妻一区二区三区无码av | 2019亚洲男人天堂| 永久久久久久久| 精品国产一区二区三区小蝌蚪 | 成人免费视频97| 日本一区二区免费电影| 欧美日韩国产亚洲一区| 中文字幕一精品亚洲无线一区| 艳妇乳肉豪妇荡乳xxx| www一区二区三区| 在线观看视频91| 无码人妻精品一区二区三区在线| 在线观看操人| 亚洲欧洲国产专区| 日韩.欧美.亚洲| 日本私人网站在线观看| 成人av网站在线| 99热在线国产| 国产黄色一级大片| 国产一区二区中文字幕| 国产精品久久久久久久久久久不卡 | 中文字幕中文字幕一区| 日本一区二区久久精品| 欧洲伦理片一区 二区 三区| av在线这里只有精品| 国产精品二区在线| 亚洲国产综合一区| 国产成人在线色| 99伊人久久| 亚洲精品第五页| 丁香另类激情小说| 国产欧美日韩在线播放| 免费看黄网站在线观看| 成人午夜在线视频| 黄色91av| 蜜桃视频在线观看网站| 久久精品网站免费观看| 欧美在线激情| 最新真实国产在线视频| 亚洲欧洲国产日本综合| 在线观看17c| 超黄网站在线观看| 婷婷夜色潮精品综合在线| 日韩精品 欧美| 日韩影片中文字幕| 精品视频999| 国产5g成人5g天天爽| 在线日韩成人| 日韩乱码在线视频| 欧洲性xxxx| 综合色一区二区| 国内揄拍国内精品| 在线永久看片免费的视频| 青椒成人免费视频| 亚洲综合成人婷婷小说| 国产91免费看| 国产日韩精品一区二区三区| 艳色歌舞团一区二区三区| 影音先锋男人资源在线| 精品久久久久久中文字幕| 女人另类性混交zo| 国产激情精品一区二区三区| 精品久久国产老人久久综合| mm131美女视频| 欧美大人香蕉在线| 久久人人爽人人爽人人片av高请| 影音先锋亚洲天堂| 麻豆精品久久久| 官网99热精品| yiren22亚洲综合伊人22| 一区二区三区在线观看动漫| 久久国产亚洲精品无码| 先锋影音网一区二区| 亚洲国产精品久久久| 美国一级黄色录像| 亚洲成人原创| 国产一区二区色| 神马久久久久久久久久| 中文字幕一区二区不卡| 国产综合av在线| 国产中文欧美日韩在线| 亚洲欧洲xxxx| 国产在线观看免费视频今夜| 免费成人美女在线观看| 精品91免费| 成人日日夜夜| 欧美视频完全免费看| 亚洲成年人在线观看| 仙踪林久久久久久久999| 日本成人在线视频网址| 好吊色在线观看| 亚洲欧美在线视频观看| 97成人在线观看视频| 亚洲一二av| www.日本久久久久com.| 免费看日批视频| 成人高清视频免费观看| 天堂av免费看| 久久国产三级| 亚洲一区二区精品| 中文字幕亚洲精品一区| 高清成人在线观看| 中文字幕精品在线播放| 欧美性生活一级| 一区二区三区视频观看| 日本一区二区免费电影| 99久久er热在这里只有精品66| 超级碰在线观看| 九九九九九九精品任你躁 | 18加网站在线| 3d成人h动漫网站入口| 黄色国产在线播放| 日韩成人一区二区三区在线观看| 久久亚洲午夜电影| 91超碰国产在线| 亚洲精品在线观看网站| 青娱乐在线视频免费观看| 国产福利一区在线| 国产免费内射又粗又爽密桃视频| 99久久999| 久久精品在线视频| 国产乱码精品一区二区三区精东| 国产精品盗摄一区二区三区| 手机视频在线观看| 青青草原综合久久大伊人精品| 国产激情久久久久| 成在在线免费视频| 欧美亚洲丝袜传媒另类| 日本欧美一区二区三区不卡视频 | 97人人模人人爽人人澡| 欧美成人国产| 国产高清一区二区三区| sm在线播放| 亚洲精品mp4| 青青青国产在线| 久久精品视频在线免费观看| 天天天干夜夜夜操| 欧美gvvideo网站| 91成人免费看| wwww亚洲| 亚洲天堂精品在线| 亚洲图片小说视频| 亚洲另类中文字| 亚洲精品国产成人av在线| 国产婷婷精品| 亚洲欧洲三级| 国产日韩一区二区三免费高清| 欧美激情a在线| 青青操在线视频| 欧美日韩国产一二三| 农村妇女精品一区二区| av一二三不卡影片| 中文字幕第80页| 中文字幕一区二区三区欧美日韩 | 色呦呦视频在线| 狠狠躁18三区二区一区| 久久精品国产亚洲AV成人婷婷| 国产精品一区二区男女羞羞无遮挡 | 91久久精品国产91性色| 岛国毛片av在线| 夜夜躁日日躁狠狠久久88av| 国产乱码久久久久| 日韩人在线观看| 看片网站在线观看| wwwwww.欧美系列| 污污网站在线观看视频| 亚洲人成免费| 亚洲一区综合| 牛牛精品成人免费视频| 91精品久久久久久久| 成人在线高清免费| 这里只有精品视频在线| 亚洲黄色在线观看视频| 欧美视频一区二| 日本少妇全体裸体洗澡| 国产精品私人影院| 女同性恋一区二区三区| 狠狠色丁香婷婷综合久久片| 大陆极品少妇内射aaaaa| 亚欧美无遮挡hd高清在线视频| 精品日产一区2区三区黄免费| 曰本一区二区| 国产精品久久一区主播| 爱啪啪综合导航| 久久精品国产亚洲一区二区| 久久精品色图| 亚洲第一网中文字幕| 中文字幕在线视频第一页| 天天色 色综合| www.99re7| 国产蜜臀av在线一区二区三区| 国产激情第一页| 国产精品一区二区男女羞羞无遮挡 | 精品一区二区三区四| 中文字幕亚洲一区二区av在线 | 日韩av一卡二卡三卡| 蘑菇福利视频一区播放| 青青草成人免费在线视频| 欧美91大片| 中文字幕一区二区三区有限公司| 国产成人黄色| 欧美日韩国产不卡在线看| 大桥未久女教师av一区二区| 7777奇米亚洲综合久久| 成人黄色理论片| 91精品久久久久| 日韩精品一级毛片在线播放| 国产精品免费一区二区三区都可以| 一本大道色婷婷在线| 97色在线观看免费视频| 欧美大胆的人体xxxx| 色综合视频一区中文字幕| 在线免费观看的av| 欧美成在线观看| caopo在线| 久久国产精品久久精品| 菠萝菠萝蜜在线视频免费观看| 久久综合色88| 26uuu亚洲电影在线观看| 精品精品国产国产自在线| 日本三级视频在线观看| 日韩网站免费观看| 麻豆传媒在线观看| 久久影院资源网| 伊人222成人综合网| 欧美精品久久久久久久| 丰满诱人av在线播放| 韩日欧美一区二区| 在线最新版中文在线| 日韩免费观看视频| 国产成人精品一区二区三区视频| 国产日韩欧美视频在线| 精品国模一区二区三区欧美| 99影视tv| 任我爽精品视频在线播放| 欧美一区二区三区成人久久片| 国产欧美日韩精品一区二区三区 | 蜜桃视频网站在线| 裸体女人亚洲精品一区| 国产精品探花在线| 26uuu另类亚洲欧美日本老年| 亚洲天堂av在线| 国产精品青青在线观看爽香蕉| 91精品一久久香蕉国产线看观看 | 91国产一区在线| 快播电影网址老女人久久| 国产欧美一区二区| 亚洲一区二区三区四区电影| 精品毛片久久久久久| 精品国内自产拍在线观看视频| 一区二区日本伦理| 一区福利视频| 无码人妻精品一区二区三区66| 精品一二三四区| 在线视频 日韩| 国产精品免费视频网站| 九九九免费视频| 日本韩国欧美国产| 国产情侣激情自拍| 亚洲精品日韩欧美| 51xtv成人影院| 日韩免费在线视频| 亚洲网一区二区三区| 日韩欧美精品一区二区| 亚洲女同一区| 欧美激情国产精品日韩| 国产精品一区专区| 欧美黄色一级生活片| 一区二区三区精品视频| 免费看日批视频| 欧美mv日韩mv| 欧美精品电影| 日本视频久久久| 91精品国产自产精品男人的天堂| 日本一区二区三区精品视频| 欧美精品1区| 国产一二三四在线视频| eeuss鲁片一区二区三区在线观看 eeuss影院一区二区三区 | 国产精品久久国产| 蜜臀av性久久久久蜜臀aⅴ| 看全色黄大色黄女片18| 亚洲欧洲日韩在线| 无码人妻av免费一区二区三区| 精品欧美黑人一区二区三区| 91看片在线观看| 青青久久av北条麻妃海外网| 试看120秒一区二区三区| 亚洲一区二区在线免费观看| 米奇777在线欧美播放| 超碰caoprom| 亚洲欧美日韩久久精品| 中文字幕久久久久| 亚洲欧美三级在线| 成年人黄色大片在线| 成人看片视频| 欧美freesex交免费视频| 在线观看免费的av| 国产精品美女久久福利网站| 久久久久久久久黄色| 日韩成人久久久| 爱搞国产精品| 精品国产乱码久久久久久久软件| 欧美/亚洲一区| 91精品视频国产| 国产精品成人午夜| 最近中文字幕免费观看| 亚洲视频自拍偷拍| 精品免费av在线| 色999日韩自偷自拍美女| 久久婷婷丁香| 亚欧洲乱码视频| 色综合天天综合网天天狠天天| 婷婷丁香一区二区三区| 97久久精品人人澡人人爽缅北| 成人性生交大片免费看96| 国产freexxxx性播放麻豆| 成人免费视频网站在线观看| 国产亚洲欧美久久久久| 精品久久久网站| gogo高清午夜人体在线| 国产精品日韩高清| 国产欧美短视频| 国产色视频一区二区三区qq号| 欧美日韩一区二区三区 | 久久综合久中文字幕青草| 国产精品国产亚洲精品| 成人在线免费高清视频| 粉嫩av一区二区三区| 国内免费精品视频| 欧美图区在线视频| 香港一级纯黄大片| 98精品在线视频| 欧美激情影院| 波多野结衣家庭教师视频| 久久久久青草大香线综合精品| 无码人妻丰满熟妇奶水区码| 在线视频亚洲欧美| 91成人小视频| 美女黄色免费看| 久久伊人蜜桃av一区二区| 波多野结衣在线观看视频| 精品国产美女在线| 伊人久久影院| 国产精品亚洲a| 中文字幕亚洲一区二区va在线| 性色av蜜臀av| 18一19gay欧美视频网站| 欧美精品尤物在线观看| 四虎成人在线播放| 亚洲图片欧美色图| 激情综合闲人网| 91在线观看免费| 亚洲精品社区| 又色又爽的视频| 精品毛片乱码1区2区3区| 免费观看亚洲| 糖心vlog在线免费观看| 91丨porny丨中文| 亚洲一卡二卡在线观看| 欧美激情中文字幕乱码免费| 久久91麻豆精品一区| 亚洲精品国产一区二区三区| 精品久久在线播放| 色视频在线免费观看| 国产日韩欧美精品| 麻豆精品蜜桃视频网站| 天天操天天干视频| 久久久久www| 欧美热在线视频精品999| 国产精品19p| 欧洲色大大久久| 国产一二三在线| 久久久无码中文字幕久...|