精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

如何在 LLM 推理中戰(zhàn)勝不確定性

人工智能
矩陣乘法是 LLM 的核心計算,快的關(guān)鍵是把大矩陣切成小 tile(比如 128x128),讓 GPU 高效算。原來的問題:批次小的時候,tile切得不一樣(比如批次 1 時不用大tile,批次 10 時用大tile),乘法順序變了,結(jié)果差了。解決辦法:不管批次大小,都用同一種 “tile大小” 算。

最近thinkingmachines的一篇博文在內(nèi)外網(wǎng)引起了無數(shù)的關(guān)注和轉(zhuǎn)載,這篇文章的核心內(nèi)容先是解釋了一下為什么LLM推理會有不確定性,隨后文章還給出了具體的解決方案。

在詳細(xì)介紹文章的內(nèi)容之前,我們先來說一下thinkingmachines這家公司。它是由前OpenAI首席技術(shù)官Mira Murati與多位前OpenAI高管聯(lián)合創(chuàng)立。Murati 這個人經(jīng)歷也比較神奇,首先她并不是AI科班出身,最早是在Tesla擔(dān)任model X的產(chǎn)品經(jīng)理。然后在2016年加入openAI,并一路升到了openai的CTO,你不得不佩服在牛人面前行業(yè)或者說專業(yè)門檻似乎根本不存在。

說完上面的八卦之后,我們開始進(jìn)入正題,先來聊一下LLM推理過程當(dāng)中的不確定性是如何產(chǎn)生的。

在這篇文章出現(xiàn)之前,大多數(shù)人認(rèn)為之所以產(chǎn)生不確定性主要是以下兩個原因?qū)е碌?

  1. 浮點數(shù)不滿足結(jié)合律:以加法運算為例,咱們平時覺得(a+b)+c 和 a+(b+c)結(jié)果肯定一樣,但用電腦里的 “浮點數(shù)”(比如表示 0.1、1e20 這種數(shù)的格式)算,還真不一樣!
(0.1 + 100000000000000000000)- 100000000000000000000,結(jié)果是 0;
0.1 +(100000000000000000000 - 100000000000000000000),結(jié)果是 0.1。

其實,這個很好理解,因為因為浮點數(shù)只能存有限位數(shù)的精度,加超大數(shù)再減,小數(shù)的 “精度” 就被丟掉了。這就導(dǎo)致了如果一堆浮點數(shù)加的順序不一樣,最后結(jié)果可能就不一樣。

2. GPU并行計算:很多人會覺得GPU 是多核心并行計算,誰先算完不一定,所以結(jié)果不一樣。

針對上面的兩個誤解,文章也一一給了回應(yīng)。首先,浮點數(shù)由于計算順序不同而導(dǎo)致丟精度確實不假,但是這個不是導(dǎo)致推理不確定性的直接原因;其次,GPU并行計算的這個說法壓根就是錯誤的,因為現(xiàn)在的 GPU kernel早就能避免 “誰先算完影響結(jié)果” 了。只有一種情況會讓 GPU 算得不一樣 —— 用 “原子加法”(多個核心往同一個數(shù)上加,誰先加不確定)。但 LLM 推理時,根本不用 “原子加法”!所以 GPU 并行不是罪魁。

文章中為了更好的解釋這個問題,提出了一個叫“batch-invariance”中文可以譯為“批次不變性”。而之所以LLM在推理時會產(chǎn)生不確性主要是因為很多的計算內(nèi)核(kernel)不滿足“批次不變性”。簡單來說就是,用戶提交的同一個推理請求單獨算和跟別人一起打包算,結(jié)果可能不一樣。文章當(dāng)中舉了一個具體的實際例子。

import torch  
torch.set_default_device('cuda')   
B = 2048
D = 4096
a = torch.linspace(-1000, 1000, B*D).reshape(B, D)
b = torch.linspace(-1000, 1000, D*D).reshape(D, D)
# Doing a matrix vector multiplication by taking
# the first element of the batch
out1 = torch.mm(a[:1], b)
# Doing a matrix matrix multiplication and then taking  
# the first element of the batch
out2 = torch.mm(a, b)[:1]
print((out1 - out2).abs().max()) # tensor(1669.2500, device='cuda:0')

上述例子當(dāng)中,用 GPU 算矩陣乘法,先取第一個請求的矩陣單獨算(out1),再把所有請求打包算完后取第一個結(jié)果(out2),兩者差了 1669 多 —— 這可不是小誤差!文章還提到一個叫運行間確定性,意思是說同一批次運算結(jié)果是一樣的。

但是現(xiàn)在很多時候,為了提高LLM推理時GPU的利用率,一都使用動態(tài)批次調(diào)度的算法。也就是說,會根據(jù)當(dāng)時服務(wù)器的繁忙程度來動態(tài)調(diào)整批次的大小。

既然問題已經(jīng)找到了,那如何解決呢?文章提到,要讓 LLM 推理穩(wěn)定,就得讓每個計算步驟(主要是 3 個關(guān)鍵步驟)不管批次大小多少,算出來都一樣。這三個步驟按難度從低到高排序依次是:

1. 歸一化(RMSNorm):給每個請求 “專屬核心”

RMSNorm 是給數(shù)據(jù)做歸一化的步驟,計算時需要 “求和取平均”。原來的問題:批次小的時候,GPU 核心用不完,就會讓多個請求共享一個核心,算的時候求和順序變了,結(jié)果也就不一樣了。解決辦法:不管批次大小,每個請求分配一個核心,讓每個請求的求和順序固定。就算批次小、有些核心空閑,也不共享 —— 大不了慢一點,換結(jié)果穩(wěn)定。

2. 矩陣乘法:固定 “計算瓷磚大小”

矩陣乘法是 LLM 的核心計算,快的關(guān)鍵是把大矩陣切成小 tile(比如 128x128),讓 GPU 高效算。原來的問題:批次小的時候,tile切得不一樣(比如批次 1 時不用大tile,批次 10 時用大tile),乘法順序變了,結(jié)果差了。解決辦法:不管批次大小,都用同一種 “tile大小” 算。哪怕批次小的時候有點浪費算力,也不換tile —— 性能會降一點(比如比最快的情況慢 20%),但結(jié)果穩(wěn)定。

3. 注意力機制(Attention):固定 “拆分大小”

注意力是 LLM 理解上下文的關(guān)鍵,計算時要處理 “查詢(Q)” 和 “鍵值(KV)” 的匹配,需要求和。原來的問題:處理長文本時,KV 會存在緩存里,批次不同時,緩存里的 KV 和新算的 KV 結(jié)合方式不一樣(比如批次 1 時拆成 3 段算,批次 5 時拆成 2 段算),求和順序變了。解決辦法:不管批次和緩存里有多少 KV,都按 “固定大小拆分”(比如每次拆 256 個元素),哪怕最后一段不夠 256 個,也按這個規(guī)則拆 —— 確保求和順序永遠(yuǎn)一樣。

文章中基于上述的方法實現(xiàn)了相應(yīng)的batch-invariant 相關(guān)實現(xiàn),具體結(jié)果如下:

  1. 用 Qwen3-235B 在溫度 0、同一提示詞采 1000 次,默認(rèn)內(nèi)核得到 80 種不同結(jié)尾;換成 batch-invariant 內(nèi)核后,1000 次完全一致。
  2. 性能上,在單 GPU、Qwen-3-8B 的例子里:vLLM 默認(rèn) 26s,未經(jīng)深度優(yōu)化的“確定性模式” 55s,改進(jìn)注意力后 42s。可見“可用、不至于災(zāi)難”。

當(dāng)然,上面主要是從我自己的視角對這篇博文的提煉,我強烈建議大家去讀一下原文。具體地址見引用。

責(zé)任編輯:武曉燕 來源: 技不辱你
相關(guān)推薦

2025-09-11 12:29:28

2023-11-13 08:00:00

Python開發(fā)

2022-05-11 09:00:00

人工智能金融犯罪機器學(xué)習(xí)

2024-02-23 14:31:19

云計算云優(yōu)化

2025-09-23 08:56:00

2020-08-24 07:04:57

邊緣計算云計算網(wǎng)絡(luò)

2022-09-14 22:51:08

機器學(xué)習(xí)模型高斯過程

2020-10-22 11:42:06

服務(wù)器

2024-01-25 16:18:38

人工智能數(shù)據(jù)

2020-05-25 10:45:48

曙光

2022-11-24 14:45:18

物聯(lián)網(wǎng)邊緣計算

2025-01-03 15:37:11

2023-04-13 11:34:49

亞馬遜云科技Serverless

2019-01-10 09:47:22

2019-05-22 14:42:40

華為谷歌挑戰(zhàn)

2022-11-04 12:27:35

2025-04-15 07:00:00

勒索軟件金融欺詐網(wǎng)絡(luò)安全

2021-01-18 15:25:46

比特幣資金私鑰

2020-12-08 10:53:36

物聯(lián)網(wǎng)安全物聯(lián)網(wǎng)IOT
點贊
收藏

51CTO技術(shù)棧公眾號

亚洲精品九九| 免费一级欧美在线观看视频| 91亚洲永久精品| 国产成人精品在线视频| 我要看一级黄色录像| 亚洲第一二区| 色国产综合视频| 日本高清xxxx| 男人久久精品| 国产一区中文字幕| 欧美亚洲日本网站| 欧美做爰爽爽爽爽爽爽| 西瓜成人精品人成网站| 欧美精品在线视频| 黄色动漫网站入口| 麻豆视频在线| 久久久精品欧美丰满| 成人91视频| 亚洲成熟少妇视频在线观看| 国语精品一区| 色婷婷综合久久久久| 日本黄色录像片| 99热这里有精品| 欧亚洲嫩模精品一区三区| 国产精品无码电影在线观看| 超碰免费在线观看| 99视频精品在线| 91久久爱成人| 国产欧美一区二区三区视频在线观看| 午夜在线精品| 久久久久久久久综合| 99热这里只有精品4| 免费av一区二区三区四区| 欧美一区二区三区视频在线| 免费在线观看的毛片| 俺来也官网欧美久久精品| 亚洲欧美日韩一区二区| 亚洲日本欧美在线| 极品美乳网红视频免费在线观看 | 国产综合av在线| 黄色免费在线看| 亚洲国产岛国毛片在线| 欧美日韩在线播放一区二区| 五月天婷婷视频| 国产91丝袜在线18| 91精品国产综合久久久久久丝袜| 亚洲中文字幕在线一区| 日韩电影免费在线看| 日本午夜精品理论片a级appf发布| 国产精品成人久久| 国产精品二区影院| 欧美大荫蒂xxx| www.色小姐com| 欧美精品1区| 欧美国产中文字幕| 国产极品国产极品| 欧美69视频| 久久91精品国产91久久跳| 亚洲欧美小视频| 中文在线播放一区二区| 久久久国产精品x99av| www.黄色com| 中文无码久久精品| 亚洲高潮女人毛茸茸| 在线免费看视频| 精品久久亚洲| 日韩视频一区在线观看| 18深夜在线观看免费视频| 激情综合婷婷| 日韩免费看网站| 亚洲v在线观看| 全球av集中精品导航福利| 亚洲精品国产精品国自产观看浪潮| 欧产日产国产精品98| 亲子伦视频一区二区三区| 日韩精品有码在线观看| 免费看裸体网站| 围产精品久久久久久久| 欧美丰满少妇xxxx| 国产成人无码精品久在线观看| 一区二区三区国产盗摄| 日本午夜精品理论片a级appf发布| 最近中文字幕免费观看| 国产乱对白刺激视频不卡| 国产一区二区在线网站| 激情视频在线观看免费| 国产精品久久久久影院色老大| 亚洲天堂第一区| 国产亚洲成av人片在线观看| 91久久精品国产91性色tv | 国产一区久久精品| 亚洲最大成人网4388xx| 国产免费黄视频| 久久久加勒比| 亚洲国产精品高清久久久| 人人妻人人澡人人爽| 欧美va天堂在线| 欧美综合在线第二页| 一二三区中文字幕| www.日韩大片| 伊人久久99| 91av久久| 欧美精品日韩一本| 国产白嫩美女无套久久| 日韩av二区| 97视频在线播放| 一个人看的www日本高清视频| 成人av手机在线观看| 日韩欧美视频一区二区三区四区| 日本动漫理论片在线观看网站 | 成人啪啪18免费游戏链接| 三级小说欧洲区亚洲区| www国产91| 亚洲黄网在线观看| 成人午夜激情影院| 亚洲毛片aa| 少妇视频在线观看| 欧美一区二区久久久| 亚洲精品国产91| 在线亚洲一区| 国产高清精品一区二区三区| 97电影在线观看| 色哟哟国产精品免费观看| 三上悠亚 电影| 天天做天天爱天天综合网2021| 欧美专区中文字幕| av男人天堂网| 国产精品久久久久久久蜜臀| 国产女大学生av| 999久久久久久久久6666| 中文字幕少妇一区二区三区| 亚洲免费黄色网址| 99久久亚洲一区二区三区青草| 裸体裸乳免费看| 91成人app| 北条麻妃在线一区二区| www.色国产| 2021国产精品久久精品| 国产黄色片免费在线观看| 亚洲欧美专区| www国产91| 国产精品久久婷婷| 中文字幕一区二区三区蜜月| 成人黄色一区二区| 精品国产一区二区三区小蝌蚪| 欧美一区二区大胆人体摄影专业网站| 成人无码一区二区三区| 一区二区三区美女| 人妻巨大乳一二三区| 亚洲成人日韩| 91视频网页| 青草在线视频| 亚洲激情电影中文字幕| av资源吧首页| 26uuu久久天堂性欧美| 无码人妻丰满熟妇区96| 亚洲a级精品| 国产91|九色| 嫩草精品影院| 欧美日韩一级片在线观看| 日韩影视一区二区三区| 蜜桃久久久久久久| 欧美 另类 交| 欧美视频三区| 国内精品久久久久久久久| 日韩中文字幕影院| 色婷婷综合久久久中文一区二区| 99久久人妻无码精品系列| 日韩综合在线视频| 亚洲一区二区四区| 欧美午夜在线播放| 性欧美xxxx| 国产福利在线| 日韩西西人体444www| 日本在线视频免费| 久久久99精品免费观看| 美女一区二区三区视频| 91精品观看| 国产一区二区在线观看免费播放 | 国产美女精彩久久| 色呦呦在线视频| 精品网站999www| 一级黄色录像大片| 亚洲一区二区视频| 在线免费观看成年人视频| 奇米一区二区三区| 久久av高潮av| 国语产色综合| 97久久人人超碰caoprom欧美| 欧美男人天堂| 波霸ol色综合久久| 天天躁日日躁狠狠躁喷水| 欧美中文字幕不卡| 久久久久无码国产精品| 久久久亚洲精品一区二区三区 | 97超碰国产精品| 亚洲男人都懂第一日本| 91亚洲人电影| xx欧美xxx| 欧美风情在线观看| 成人性生交大片免费看午夜| 日韩精品综合一本久道在线视频| 亚洲天堂男人av| 一区二区三区波多野结衣在线观看| 大地资源二中文在线影视观看| 麻豆精品视频在线观看免费| 2018日日夜夜| 99精品美女| 秋霞在线观看一区二区三区| 亚洲国产中文在线| 国产精品人成电影| 日本不卡免费高清视频在线| 欧美大成色www永久网站婷| 国产精品一区在线看| 亚洲国产成人精品女人久久久 | 波多野结衣一区二区三区在线| 一区二区三区四区五区视频在线观看| 免费毛片视频网站| 成人av影院在线| 免费高清视频在线观看| 奇米精品一区二区三区在线观看 | 一级做a爰片久久毛片美女图片| 精品毛片一区二区三区| 欧美日韩综合在线免费观看| 日本系列第一页| 亚洲激情av在线| 成人在线观看免费完整| 国产精品免费免费| 欧美多人猛交狂配| 97se亚洲国产综合自在线不卡 | 国产夜色精品一区二区av| 色悠悠在线视频| 国产成人免费视频精品含羞草妖精 | 真实乱视频国产免费观看| 成人午夜私人影院| 无码人妻aⅴ一区二区三区玉蒲团| 精品影院一区二区久久久| 搡女人真爽免费午夜网站| 久久久蜜桃一区二区人| 天天夜碰日日摸日日澡性色av| 海角社区69精品视频| japanese在线播放| 亚洲精彩视频| 国产日韩欧美大片| 欧美一区二区三区久久精品茉莉花 | 五月婷婷开心中文字幕| 精品国产制服丝袜高跟| 丰满少妇在线观看bd| 精品美女一区二区| 成人激情四射网| 精品欧美乱码久久久久久| 亚洲欧美强伦一区二区| 精品欧美一区二区三区精品久久| 好吊色一区二区三区| 亚洲国产精品嫩草影院久久| 午夜小视频免费| 精品亚洲一区二区三区在线观看 | 91精品国产高清自在线| 超碰高清在线| 欧美专区日韩视频| 成人国产精品入口免费视频| 国产精品免费观看在线| www.久久热| 成人av免费在线看| 欧美日韩一区二区三区四区不卡 | 欧美孕妇孕交xxⅹ孕妇交| 亚洲欧洲免费视频| 日本中文在线观看| 欧美成人免费va影院高清| 国产盗摄精品一区二区酒店| 97视频com| 成人国产精品入口免费视频| 亚洲va久久久噜噜噜久久天堂| 日韩中文在线| 蜜桃网站成人| 99久久婷婷| 欧美日韩黄色一级片| 日日噜噜夜夜狠狠视频欧美人| 不卡中文字幕在线观看| caoporn国产精品| 99精品全国免费观看| 亚洲激情六月丁香| 福利网址在线观看| 9191久久久久久久久久久| 刘亦菲毛片一区二区三区| 亚洲欧美综合另类中字| 国产精品剧情一区二区在线观看 | 久久青青草视频| 欧美日韩国产欧美日美国产精品| 国产成人手机在线| 一本色道久久综合狠狠躁篇的优点| 最新国产在线拍揄自揄视频| 欧美亚洲一级片| av在线播放一区二区| 久久精精品视频| 亚洲精品国产成人影院| 亚洲 欧美 日韩 国产综合 在线| 麻豆精品一区二区综合av| 国产精品扒开腿做爽爽爽a片唱戏| 国产色综合久久| 美女毛片在线观看| 欧美午夜精品一区二区三区| 成人小说亚洲一区二区三区| 正在播放欧美视频| www在线观看黄色| 51国产成人精品午夜福中文下载| 欧美久久香蕉| 99中文字幕在线观看| 日本欧美一区二区在线观看| 在线精品视频播放| 国产精品成人一区二区三区夜夜夜| 日韩欧美国产亚洲| 91麻豆精品91久久久久久清纯| 日本福利在线观看| 韩国福利视频一区| 欧美区一区二区| 亚洲一区二区精品在线| 久久欧美肥婆一二区| 日本50路肥熟bbw| 亚洲男人的天堂一区二区| 天堂免费在线视频| 日韩精品在线私人| av中文在线资源| 99re在线| 欧美二区不卡| 欧美国产在线一区| 国产精品久久久久7777按摩| 欧美brazzers| 亚洲欧美日韩国产中文专区| 国产免费拔擦拔擦8x在线播放| 国产aⅴ精品一区二区三区黄| 艳女tv在线观看国产一区| 国产又黄又猛又粗| 久久久久久久久久久久久夜| 丰满少妇乱子伦精品看片| 亚洲第一页在线| 九色91在线| 国产精品yjizz| 欧美视频不卡| 国产午夜在线一区二区三区| 一区二区三区高清在线| 亚洲国产999| 欧美黑人巨大精品一区二区| 亚洲成人黄色| 国产freexxxx性播放麻豆| 成人午夜视频网站| 日韩欧美亚洲视频| 日韩大片免费观看视频播放| 九色porny丨首页入口在线| 国产欧美日本在线| 国产视频一区欧美| av网站免费在线播放| 欧美日韩亚洲系列| 黄色av免费在线观看| 国产成人一区二区| 第一会所亚洲原创| 中文字幕第38页| 亚洲人亚洲人成电影网站色| 国产免费一区二区三区最新不卡 | 人人精品久久| 桥本有菜av在线| 风流少妇一区二区| av资源免费观看| 国产亚洲视频中文字幕视频| 欧美日韩破处视频| 久久免费一级片| 99久久99久久久精品齐齐| 国产午夜免费福利| 色老头一区二区三区| 国产一精品一av一免费爽爽| 男人天堂av片| 久久精品欧美日韩精品| 91国偷自产中文字幕久久| 欧美国产日韩在线| 妖精一区二区三区精品视频| 香蕉视频禁止18| 亚洲乱码中文字幕| 五月天婷婷视频| 国产一区二区色| 韩国欧美一区| 国产熟女一区二区| 日韩欧美中文字幕制服| 亚洲天堂电影| 一区二区三区一级片| 99久久免费精品| 最近中文字幕在线观看视频| 久99九色视频在线观看| 久久99影视| 国产精品偷伦视频免费观看了| 日韩欧美成人网| 手机在线免费观看av| 日本一区高清在线视频| 国产成人综合自拍| 中文字幕手机在线视频| 久久av资源网站| 沈樵精品国产成av片| 日本成人在线免费观看| 91福利区一区二区三区| 色屁屁www国产馆在线观看| 日本高清视频一区二区三区|