精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

從GPT-OSS談談大模型算法和Infra演進

人工智能
gpt-oss開源了,整個模型架構的設計真的是非常的simple & elegant,本文結合一些前段時間一些Infra相關的爭議和自己開發Agent相關的分析, 來對未來模型架構演進做一些分析。

TL;DR

gpt-oss開源了,整個模型架構的設計真的是非常的simple & elegant。本文結合一些前段時間一些Infra相關的爭議和自己開發Agent相關的分析, 來對未來模型架構演進做一些分析。

1. Overview

OpenAI這次開源的是gpt-oss-20b 和 gpt-oss-120b兩個模型。

圖片圖片

在自己的mac m4pro上運行了一下20b的模型, 基于LM Studio輸出為38 token/s, 非??焖倭恕R恍I問題回答思路和格式都也很不錯, 這也使得很多小規模部署, 特別是基于它做一些簡單的Agent任務成為可能。

Attention使用了GQASliding-window GQA交替的方式, 當然Llama 4也這么干過, 同時還有一個Attention Sink來解決一些long context的任務. 同時這樣的結構對于KVCache的處理有很多可以在推理優化中進一步挖掘的地方。

MoE上, 小的20b模型采用了4Active/32Routed, 而較大的120b采用了4Aactive/128Routed. 比較有趣的是Intermediate Size = Hidden Size = 2880. 為什么不升維度呢? 然后MLP還帶了Bias. 激活函數用了SwiGLU帶了clamp并且, 它的EP并行是如何實現的呢?

然后Reasoning的強度也有高中低的區別...另外和國內一些開源模型相比, 它的最大特點就是層數特別少. 120b只有36層....這樣就直接的提高了TPS。

這些疑問都有很多值得推敲的地方。

2. Attention

在Attention這一塊, 首先是使用了GQASliding-window GQA交替的方式, 即Hybrid Attention. 在Llama 4中其實也見到過, 但是沒有像OAI這樣interleave的方式. 這樣的好處有幾點: 首先計算量少了很多, KVCache也少了很多, 特別是Long-context的情況下。

但是有一個疑問, 如果未來針對更大規模的模型例如一個1T參數左右的GPT-5如果還是這樣的方式, 模型可能要繼續加寬和加深? 那么勢必也會進行一些分布式的推理, EP并行或者AFD怎么處理呢? GQA應該是可以有效的使用AFD和EP的, 而對于Sliding-window GQA本身計算時間會短很多, 那么可能還是和MLP融合? 對于這類hybrid attention的模型如何overlap是一個很好玩的事情。

另外是對于不同的請求context-length在Agent場景也會存在很大的差異, 是不是還有一個根據context不同來配對Decoding的調度算法呢? 實際上對于一個Stateful且計算量和存儲長度都有很大差異的情況下, 類比于大數據中的一些Remote Shuffle方式處理數據偏斜, 通過layerwise的KVCache傳輸來處理呢? 這樣來實現一些長context請求驅逐出某個decoding cluster? 同時有一些額外的KVCache內存池作為Stateful的存儲似乎也有不少辦法去做一些事情?

而本質上,針對不同的context長度, 如果有一種大家計算時間都差異不大的方式那不是更好么?們注意到DeepSeek的NSA其實也是使用了Sliding window的方式, 然后使用Gated Output。同時又采用了block selection機制使得整體的計算時間并不會隨著context的差異變化過大。

圖片圖片

其實從個人的視角來看, 我可能會更偏向于NSA, 特別是Agent場景. 很多工具返回的結果剛好像內存管理那樣, 按照Page可以填充到Block中。這樣Agent context engineering和NSA本身可以做很多的協同設計了。

另一方面最近在看Google的一篇論文《Learning without training:The implicit dynamics of in-context learning》[1]

Attention本身產生兩種輸出, 一種是查詢x的輸出A(x), 另一種是有Context的輸出A(C,x)。兩者的delta就包含了上下文本身的信息. 當這個Delta經過MLP后, 等價于增加了一個很簡單的scratchpad。

圖片圖片

然后這篇論文還有一個很好的結果, 使用原始的權重處理A(C,x)等同于使用新的權重 處理x。這樣模型不用重新訓練又可以進一步的根據上下文更新參數了, 似乎很值得期待, 特別是結合Sutton的The Era of Experience。前段時間我也在考慮如何通過模型推理的經驗來動態改變prompt. 感覺這條路又可以做不少事情了。

另一方面Attention的一個比較好的實現是Sink Attention, 大致意思是context長了以后, 注意力全中多集中在開始的幾個token, 例如論文《Efficient Streaming Language Models with Attention Sinks》[2]

另一篇論文是DeepMind的《Transformers need glasses!  Information over-squashing in language tasks》[3] 也提到了類似的問題。

圖片圖片

SteamingLLM的做法就是通過Attention Sink來分散注意力, 使得中段和尾段注意力.. gpt-oss創建了一些可學習sink參數, 然后處理如下:

self.sinks = torch.nn.Parameter(
    torch.empty(config.num_attention_heads, device=device, dtype=torch.bfloat16)
)
        
t = sdpa(q, k, v, self.sinks, self.sm_scale, self.sliding_window)

def sdpa(Q, K, V, S, sm_scale, sliding_window=0):
    S = S.reshape(n_heads, q_mult, 1, 1).expand(-1, -1, n_tokens, -1)
    ...
    QK = torch.einsum("qhmd,khmd->hmqk", Q, K)
    ...
    QK = torch.cat([QK, S], dim=-1) #拼接Sink
    W = torch.softmax(QK, dim=-1) #計算帶Sink的softmax
    W = W[..., :-1] #丟棄Sink權重
    attn = torch.einsum("hmqk,khmd->qhmd", W, V)

其實我覺得還有一個補充的點是做一些自適應溫度的工作? 也是來自Deepmind 《Softmax is not Enough (for Sharp Size Generalisation) 》[4]

圖片圖片

最后還有一個小細節, attn head-dim =64 ? 小了很多, 查詢了一下蘇老師的文章《關于維度公式“n > 8.33 log N”的可用性分析》[5],好像只有在Sliding-window GQA上是匹配的. 為了遷就這個而構成的一個Trade-off?

另一個問題就來了, 針對國產的各種NPU算力又要怎么搞呢?

3. MoE

其實對于120B的模型, 還是采用的Finegrain的Experts, 專家數128個. 但是沒有Shared Expert. 其實算法上去掉Shared也沒啥問題. 但是Fine grain本身的意義就不在多說了. 關鍵的問題回到Intermediate Size = Hidden Size = 2880. 為什么不升維度呢?  因為這個模型本來大小就相對小一點, 新的B200一類的卡顯存賊大. 4個Expert直接拼接在一起不就成了一個intermediate = 4 * hidden size大矩陣了么?

然后MLP還帶了Bias. 激活函數用了SwiGLU帶了clamp并且, 實際上也構成了一個殘差項的連接. 這些設計的動機是什么我不知道...

其實這一塊,如果我們要走hybrid attn的路, 做EP或者AFD似乎還有一些事情要處理. 特別是Sliding-window GQA的那一層. 突然想到一個idea, 兩批請求錯層去做overlap, 然后通過GreenContext去限制Full GQA和 Sliding-window GQA的計算資源是不是有收益呢?

至少我們看到的是在Attn上大家都在想方設法去解決long-context的各種效率問題, 這些問題解決了A和F之間的差異其實也就開始變小了...不過OAI這種Intermediate :hidden = 1:1 的設計是否在更大的模型上會采用, 還是針對小模型的時候拼接處理容易做的一些設計, 我不知道... 或許一些更大規模的模型, 例如1T參數的又繞到1:4. 感覺這里還是有不少設計空間的...

4. 總結

總體來看, 這次CloseAI再次Open帶來了不少變化, 這些變化似乎又給Infra賞了一口飯吃. 模型-系統-硬件的協同又有好多活干了~ 還有一些gpt-oss-mcp-server和tools的API挺有趣的, 后面再花時間學習吧!

參考資料

[1] Learning without training: The implicit dynamics of in-context learning: https://arxiv.org/pdf/2507.16003

[2] Efficient Streaming Language Models with Attention Sinks: https://arxiv.org/html/2309.17453v4

[3] Transformers need glasses! \faGlasses Information over-squashing in language tasks: https://arxiv.org/html/2406.04267v2

[4] Softmax is not Enough (for Sharp Size Generalisation): https://arxiv.org/html/2410.01104v3

[5] 關于維度公式“n > 8.33 log N”的可用性分析: https://kexue.fm/archives/8711

責任編輯:武曉燕 來源: zartbot
相關推薦

2025-08-18 09:15:00

2025-08-07 14:05:40

OpenAI大模型開源

2025-08-19 08:40:00

AI技術模型

2025-08-07 09:05:45

2025-08-13 11:42:09

2025-08-12 09:12:00

2025-08-11 18:00:38

AI模型推理

2025-08-15 08:17:41

2023-03-31 14:33:49

人工智能數據開發自然語言

2024-05-07 08:07:30

云原生

2025-10-24 10:34:55

2025-08-06 14:09:40

模型OpenAIgpt-oss

2023-05-16 08:01:13

架構網站演進

2017-09-22 16:08:16

Python協程編程

2021-12-27 08:04:49

架構網站高并發

2023-04-26 07:56:45

大模型機器學習

2025-10-13 15:52:11

AI論文模型

2024-02-01 08:09:31

GPT容器模塊

2024-11-25 08:20:22

點贊
收藏

51CTO技術棧公眾號

日韩欧美国产成人精品免费| 我要看一级黄色大片| 亚洲福利在线观看视频| 亚洲国产91| 亚洲午夜国产成人av电影男同| 91看片在线免费观看| 1区2区在线观看| 成人av综合在线| 国产精品美女无圣光视频| 欧美成人777| 精品一区毛片| 日韩一区二区三区在线视频| 久久久久久久久久久久久国产精品| 日本a级在线| 91麻豆视频网站| 成人免费淫片视频软件| 你懂的国产在线| 五月天久久网站| 亚洲人成电影网| 亚洲成人激情小说| 久久麻豆视频| 欧美性猛交xxxx| 国产爆乳无码一区二区麻豆 | 国产蜜臀在线| 国产精品乱码人人做人人爱| 久99久视频| www.久久久久久久久久| 奇米777欧美一区二区| 性色av一区二区咪爱| 国精产品一区一区二区三区mba| 羞羞色国产精品网站| 日韩一级二级三级| 15—17女人毛片| 老司机成人影院| 亚洲成a人片综合在线| 婷婷视频在线播放| 在线国产91| 久久精品视频在线看| 国产精品.com| www.成人免费视频| 久久精品国产99国产精品| 欧美专区日韩视频| 日韩乱码一区二区| 一区视频在线看| 久久久视频在线| 久草视频免费在线| 欧美91大片| 不卡av电影院| 成人无码精品1区2区3区免费看 | 韩国v欧美v日本v亚洲v| 国产精品劲爆视频| 亚洲午夜在线播放| 强制捆绑调教一区二区| 国产精品高精视频免费| 狠狠躁夜夜躁人人爽视频| 久久婷婷一区| 国产精品久久久久久久久久久不卡 | 艳妇乳肉豪妇荡乳xxx| 欧美h版在线观看| 日韩一级二级三级| 性高潮免费视频| 好吊妞视频这里有精品 | 黑人狂躁日本妞一区二区三区| 日韩精品在线观看av| 免费电影网站在线视频观看福利| 亚洲精品久久嫩草网站秘色| 亚洲中文字幕无码一区二区三区| 日韩三级免费| 精品久久香蕉国产线看观看gif| 欧美日韩成人免费视频| 成人福利视频| 欧美性欧美巨大黑白大战| 欧美日韩在线成人| 外国成人毛片| 日韩欧美一级二级三级| 波多野结衣有码| 自拍偷拍欧美一区| 在线色欧美三级视频| 成人欧美一区二区三区黑人一| 久久久久久久久国产一区| 久久免费福利视频| 91video| 狠狠色丁香婷综合久久| 国产精品免费在线| 全色精品综合影院| 国产精品久久久久一区| 99热这里只有精品免费| 亚洲欧洲高清| 欧美日韩二区三区| 亚洲制服丝袜在线播放| 国产一区二区三区日韩精品| 久久夜色精品国产亚洲aⅴ| 动漫精品一区一码二码三码四码| 亚洲一区不卡| 成人免费视频在线观看超级碰| 欧美一级视频免费| 中文字幕欧美国产| 日韩中字在线观看| 欧美日韩国产网站| 日韩免费高清视频| www.av天天| 欧美成人一区二免费视频软件| 26uuu另类亚洲欧美日本一| 亚洲一级片免费看| 成人黄色小视频在线观看| 色一情一乱一伦一区二区三区丨| 天堂av最新在线| 在线观看欧美日本| 亚洲一二三四五| 日韩在线综合| 欧美在线激情视频| 精品国产av一区二区三区| 久久久99精品免费观看| 国产一二三四五| 美女色狠狠久久| 亚洲精品在线一区二区| 久久福利免费视频| 三级久久三级久久| 国产偷国产偷亚洲高清97cao| 视频一区二区三区不卡| 欧美丝袜第一区| 美女伦理水蜜桃4| 99久久久久| 国产精品国模在线| 日本1级在线| 天天av天天翘天天综合网色鬼国产| 亚洲图色中文字幕| 精品久久久久久久| 日本韩国在线不卡| 亚洲日本国产精品| 亚洲国产欧美在线人成| 香蕉视频xxxx| 国产韩日影视精品| 国产精品无av码在线观看| 国产在线视频资源| 欧美日韩在线看| avtt香蕉久久| 亚洲精选成人| 国产精品我不卡| 国模雨婷捆绑高清在线| 欧美v亚洲v综合ⅴ国产v| 91 在线视频| 狠狠网亚洲精品| 国产欧美自拍视频| 欧美激情三级| 九九热这里只有精品6| 精品欧美一区二区精品少妇| 亚洲免费看黄网站| 亚洲综合123| 欧美日韩午夜| 国产欧美日韩伦理| 69av成人| 精品国产凹凸成av人导航| 国产精品成人久久| 不卡一区在线观看| 日本不卡在线观看视频| 五月国产精品| 国产精品电影久久久久电影网| 男女av在线| 欧美日韩在线播放| 欧美一级片在线视频| 国产伦精品一区二区三区视频青涩 | 国产精品久久久久77777| a中文在线播放| 欧美顶级少妇做爰| 青青操国产视频| 成人av高清在线| www黄色日本| 黑人操亚洲人| 91精品视频在线播放| 免费网站在线观看人| 亚洲美女视频网| 黄色大全在线观看| 亚洲女人小视频在线观看| 激情小说欧美色图| 欧美亚洲自偷自偷| 一区二区视频在线免费| 91久久偷偷做嫩草影院电| 97色在线视频观看| 91视频在线观看| 日韩精品专区在线影院重磅| 毛片视频网站在线观看| 中文字幕日本乱码精品影院| 日本天堂在线播放| 强制捆绑调教一区二区| 成人小视频在线观看免费| 一区二区三区日本久久久| 国产欧美亚洲视频| av在线播放资源| 怡红院精品视频| 色丁香婷婷综合久久| 欧洲视频一区二区| 久久综合色综合| 国产精品剧情在线亚洲| 午夜男人的天堂| 麻豆国产精品官网| 99热亚洲精品| 66久久国产| 日韩在线第一区| 北条麻妃在线一区二区免费播放| 国产精品18久久久久久首页狼| 午夜成年人在线免费视频| 国产一区二区三区中文| 成人毛片在线免费观看| 欧美性猛交一区二区三区精品| xxxxxx国产| 亚洲欧美日韩成人高清在线一区| 波多野结衣av在线免费观看| 国产一区二区三区四区五区美女| 国产又大又硬又粗| 亚洲国产日本| 国产精品av免费| 精品国内自产拍在线观看视频| 国产精品一区二区三区四区五区| 国产精品久久久久久妇女| 国外成人性视频| 好了av在线| 中文欧美日本在线资源| 欧美少妇另类| 亚洲第一福利网| 国产视频手机在线观看| 欧美性猛交xxxx乱大交退制版| 日韩三级小视频| 一级中文字幕一区二区| 91久久久久久久久久久久久久 | 久久成人在线| 97超碰人人澡| 亚洲福利电影| 国产www免费| 亚洲夜间福利| 欧美中日韩在线| 欧美激情91| 日本三级中文字幕在线观看| 久久婷婷蜜乳一本欲蜜臀| 日韩经典在线视频| 久久综合亚洲| 久久久久久欧美精品色一二三四| 成人影院中文字幕| 国产精品二区二区三区| 97se亚洲国产一区二区三区| 91超碰在线电影| 999精品视频在线观看| 国产女同一区二区| 国产成人a视频高清在线观看| 国产精品精品视频| 精品乱码一区二区三区四区| 国产精品揄拍500视频| 成人日韩av| 成人乱色短篇合集| 欧美经典影片视频网站| 亚洲一区二区三区777| 免费精品一区二区三区在线观看| 亚洲一区二区三区香蕉| 天堂va欧美ⅴa亚洲va一国产| 亚洲va久久久噜噜噜| 精品国产麻豆| 91九色偷拍| 国产精品15p| 久久久精品有限公司| 国产亚洲一区二区三区啪| 亚洲精品中文字幕乱码三区不卡 | 在线观看精品国产视频| 77777影视视频在线观看| www欧美日韩| 主播国产精品| 欧美激情精品久久久久久| 国产精品一区二区日韩| 日韩美女在线播放| 久久亚洲人体| 都市激情久久久久久久久久久| 福利欧美精品在线| 日本一区视频在线| 水蜜桃精品av一区二区| 日本黄色片一级片| 国产欧美午夜| 国产wwwxx| 国产成人精品亚洲日本在线桃色| 国产人成视频在线观看| 成人深夜福利app| 瑟瑟视频在线观看| 亚洲欧美日韩一区二区三区在线观看 | 欧美成人xxxxx| 久久福利资源站| 亚洲色图欧美另类| 久久久不卡网国产精品一区| 欧美一级片在线视频| 婷婷中文字幕一区三区| 在线免费观看日韩视频| 欧美r级电影在线观看| 国产日韩精品在线看| 久久影院中文字幕| 成人直播视频| 成人激情电影一区二区| 日韩精品社区| 在线不卡日本| 国产日韩欧美高清免费| 小泽玛利亚视频在线观看| 成人免费毛片片v| 国产第一页精品| 午夜精品久久久久久久久| 一区二区不卡视频在线观看| 亚洲国产91精品在线观看| 日韩专区在线| 97人洗澡人人免费公开视频碰碰碰| 全球最大av网站久久| 国产私拍一区| 欧美99久久| 激情五月婷婷久久| 大陆成人av片| 日韩精品123区| 在线观看三级视频欧美| 深夜福利视频网站| 欧美裸身视频免费观看| 素人啪啪色综合| 蜜桃久久影院| 亚洲黄色av| 色姑娘综合天天| 国产精品国产三级国产aⅴ中文 | 国产一区二区黄色| 99久久视频| 天天色综合天天色| 99久久综合国产精品| 免费一级黄色大片| 日韩欧美一区二区在线视频| 在线视频91p| 国产aⅴ夜夜欢一区二区三区| 老汉色老汉首页av亚洲| 日韩欧美猛交xxxxx无码| 精品一区二区三区久久| 国产美女免费网站| 无吗不卡中文字幕| 狠狠躁日日躁夜夜躁av| 欧美精品日韩三级| 精品国产乱码一区二区三区| 一区二区欧美日韩| 精品中文av资源站在线观看| 国产又粗又长又硬| 欧美日韩午夜精品| 日本高清在线观看wwwww色| 国产欧美日韩精品丝袜高跟鞋| 九九视频精品全部免费播放| 无码人妻丰满熟妇区96| 91麻豆高清视频| 国产香蕉视频在线| 亚洲精品在线91| av高清不卡| 欧美三日本三级少妇三99| 欧美三级午夜理伦三级中文幕| 中文字幕 91| 国产精品久久久久影视| 一级片一区二区三区| 久久亚洲春色中文字幕| 日韩成人久久| 美脚丝袜脚交一区二区| 99久久精品99国产精品| 亚洲另类在线观看| 中文字幕av一区中文字幕天堂| 成人1区2区| 精品少妇人妻av一区二区| 国产精品69毛片高清亚洲| 免费一级特黄特色大片| 日韩精品在线影院| 韩国成人在线| 一级黄色录像免费看| 国产成人综合亚洲91猫咪| 国产无套粉嫩白浆内谢| 亚洲精品之草原avav久久| 成人免费av电影| 综合色婷婷一区二区亚洲欧美国产| 精彩视频一区二区三区| 久草免费新视频| 精品伊人久久97| 精品九九久久| 妺妺窝人体色www看人体| 91日韩精品一区| 中文字幕欧美人妻精品一区蜜臀 | 日韩免费毛片| 国内精品伊人久久久久影院对白| 劲爆欧美第一页| 日韩精品久久久久久福利| 91国内外精品自在线播放| 五月天综合婷婷| 91麻豆国产在线观看| 91精品国产乱码久久久| 欧美精品久久一区二区| 波多野结衣的一区二区三区| 免费欧美一级片| 一本色道亚洲精品aⅴ| 国产视频一区二区| 美女三级99| 国产乱一区二区| 五月婷婷激情视频| 欧美大成色www永久网站婷| 亚洲宅男一区| www.午夜av| 在线一区二区三区做爰视频网站| 大片免费在线观看| 欧美精品二区三区四区免费看视频 | 日韩理论片av| 亚洲欧美日本一区|