精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI 成本賬:LLM 推理成本鏈條分析

發布于 2025-7-11 07:20
瀏覽
0收藏


一、背景

最近看到 SemiAnalysis 團隊制作了一個《AI Token Factory Economics Stack》的圖片(來自 SemiAnalysis (@SemiAnalysis_) / X [1]),深入分析了 LLM 推理成本鏈條中各個參與者的成本與利潤情況,涵蓋從硬件資本支出(Neocloud)、推理服務提供商(Inference Providers)到終端應用層(Applications)的全棧視角,并且以 H200 GPU 為例,進行定量分析。

AI 成本賬:LLM 推理成本鏈條分析-AI.x社區

考慮到之前主要關注整體的 CapEx(資本成本)和 Opex(運維成本),因此借此機會進一步理解成本計算的相關邏輯和方式。

二、Neocloud(基礎設施)

Neocloud 主要是云廠商,提供 GPU 租賃服務,比如 Lambda、Vast.ai、Oracle Cloud 等。

2.1 關鍵概念

Capital Cost per GPU(資本支出):可以理解為一次性支出的買入價,是資產價格。

Colocation Cost(托管成本):指將 GPU 服務器放入一個已有數據中心機房中,由該數據中心提供電力、冷卻、物理空間、安全、網絡接入等基礎設施服務所需支付的費用。簡單理解就是:“我出設備,你出機房+電力+空調+網絡,我按月支付托管費用?!?/p>

Cost of Capital(資本成本率):使用這筆資金(一次性支出的資產成本)必須計算“時間成本”,比如一個企業獲得一個 GPU 有兩種方式:

  • 現金購買 GPU(自有資金):這些錢本可以去買理財、股票,比如年回報 ≥13.3%。
  • 貸款買 GPU(外部融資):銀行利率是 13.3%。

2.2 數據指標

核心數據:

  • Capital Cost per GPU(每張 H200 GPU 的資本支出):$34,698
  • Colocation Cost(托管成本):$130 / kW / 月
  • Electricity Cost(電費):$0.087 / kWh
  • Cost of Capital(資本成本率):13.3%/年
  • 這些值用于計算 GPU 的總擁有成本(TCO)為: $1.66/hr/GPU。

收益指標:

  • Neocloud Pre-tax Profit Margin(稅前利潤率):16.8%
  • Neocloud Rental Price(對外出租價格):$2.00/hr/GPU

總結:說明云廠商通過租賃 GPU,可以獲得 16.8% 的利潤空間。

2.3 計算方式

2.3.1 CapEx

其中的 Capital Cost per GPU 和 Cost of Capital 共同構成了我們常說的 CapEx,通常將其在 GPU 的使用生命周期內進行攤銷。業內常見最短的攤銷周期是 3 年,主要是 AI 硬件的更新迭代周期往往不會超過 3 年;AI 模型、應用場景也在不斷演進,3 年后通常也會有更有性價比的 GPU 出現。然而,即使新的 GPU 開始投入使用,上一代 GPU 仍可持續發揮一定性能價值。在公司內,通常會進一步將攤銷周期延長到 4 年甚至 5 年。

如果按照 3 年的攤銷周期,則相應的成本為:

34698*(1+13.3%*3)/(3 * 365 * 24) = $1.847/hr/GPU

如果按照 4 年的攤銷周期,則相應的成本為:

34698*(1+13.3%*4)/(4 * 365 * 24) = $1.517/hr/GPU

如果按照 5 年的攤銷周期,則相應的成本為:

34698*(1+13.3%*5)/(5 * 365 * 24) = $1.319/hr/GPU

當然,有些時候也會采用年金法按固定時間周期(比如每年)平均“攤銷”,則對應的年金 A 可以表述為(假設還是按照 4 年的攤銷周期):

AI 成本賬:LLM 推理成本鏈條分析-AI.x社區

則相應的成本為:

11928/(365*24) = $1.362/hr/GPU

2.3.2 Opex

其中 Opex 主要對應上述的 Colocation Cost 和 Electricity Cost,折算到每 GPU 每小時的成本為:

Colocation Cost:130 / 30 / 24 ≈ $0.181/hr/GPU

Electricity Cost:0.7kW × $0.087 = $0.061/hr/GPU

H100/H200 GPU 的峰值功耗為 700W,而 8 卡 DGX H100/H200 的峰值功耗為 10.2kW(還額外包括 CPU、散熱等其他組件)。實際整機的最大功耗通常只能達到 70%-80% 左右,因此平均到每個 GPU 的功耗可能在 1kW 左右,考慮到 GPU 并非始終滿載運行,且這里的電力成本占比相對較小,故依然按 700W 進行估算。綜上,總的 Opex 為:

0.181 + 0.061 = $ 0.242/hr/GPU?

?2.3.3 TCO

基于上述 CapEx 和 Opex 可以推出大概的 TCO(Total Cost of Ownership)為:

3 年期攤銷:1.847 + 0.242 = $2.089/hr/GPU

4 年期攤銷:1.517 + 0.242 = $1.759/hr/GPU

5 年期攤銷:1.319 + 0.242 = $1.561/hr/GPU

4 年期攤銷(年金法):1.362 + 0.242 = $1.604/hr/GPU

而上述表格中估計的 TCO 為 $1.66/hr/GPU,而實際的租賃價格 Neocloud Rental Price 為 $2/hr/GPU。由此可見,以約 4 年期攤銷為基礎的成本估算較為合理,按照上述價格,Neocloud 大概有 16.8% 的利潤空間。?

2.4 補充

?需要說明的是,隨著供需關系變化、硬件及算法的迭代,GPU 租賃的價格往往會隨著時間的發展逐漸降低,上述只是比較粗略的計算方式。

比如說,H100 剛上市時的租賃價格甚至高達 $8/hr/GPU,一年前也有 $4-$5 左右。如下圖所示,一年前 Lepton AI 上 H100 的租賃價格為 $4.2/hr/GPU。?

AI 成本賬:LLM 推理成本鏈條分析-AI.x社區

而現在(更新于 2025 年 6 月 25 日)很多云廠商的價格已經下降到 $2-$3 之間。此外,對于大客戶或長期租賃通常還能拿到更低的價格(來自:Nvidia H100 - GPU Price Comparison [2]):

AI 成本賬:LLM 推理成本鏈條分析-AI.x社區

三、Inference Provider(推理服務提供商)

3.1 資產成本與利用率

?其中的主要成本是 GPU 租賃成本,也就是上述由 Neocloud 決定的 $2.00/hr/GPU。

租賃的 GPU 不可能 100% 使用,對于 Online 流量(比如 OpenAI 的在線 Chat 場景),受流量波動影響,GPU 難以實現持續滿負荷運行。此時,可以考慮使用 Offline 流量(比如 Batch Process,當然價格可能更便宜)來充分利用波谷的空閑資源。圖中作者簡化為 Effective Utilization Rate(有效利用率)為 75%,也就是 GPU 只有 75% 的有效使用。?

3.2 推理成本

AI 成本賬:LLM 推理成本鏈條分析-AI.x社區

3.3 銷售定價 & 利潤率

?在資產成本與利用率確定的情況下,Inference Provider 想要提升利潤率的主要手段就是提升 LLM 推理性能,降低推理成本。這里作者以 TRT-LLM 框架為例,使用 FP8 推理,以保證盡可能的高效推理。以 1K 輸入 + 4K 輸出(總共 5K Token)為例,其推理耗時 190s,吞吐可以達到 442 Tokens/s/GPU。

基于上述數據可以推算出:

有效 Tokens/hr/GPU:442 * 3600 * 75% = 1,193,400

考慮到 GPU 租賃成本為 $2,則每百萬 Token 成本為:

Inference Compute Cost:2 / 1,193,400 * 1,000,000 = $1.676

相比于輸入、輸出 Token 按照相同價格計費的方式,輸入輸出分別計價的方式會更加靈活,比如 OpenAI 就是這種方式。并且其早期的定價策略為:輸出價格為輸入價格的 3 倍。后來都改成 4 倍,如下圖所示。對于用戶而言,如果是長輸入、短輸出的場景(比如文獻總結、知識庫等),使用這種方式也許可以獲得更低的總成本。?

四、Application(應用產品)

Application 主要是 ChatGPT、Perplexity、Claude、Notion AI、Cursor 等終端產品。

4.1 用戶層面關鍵數據

假設每個用戶每月使用 Token 數量為:6M Tokens。

Token 單價為:$2.00 / M Tokens。

每月活躍用戶數(MAU)為:1.8M。

月均用戶收入(Average Revenue per User):$20。

4.2 利潤率

基于上述數據可以得出:

每月每用戶毛利(Gross profit per User per Month):20 - 6 * 2 = $8

應用層毛利率(Application Gross Margin):(20 - 8) / 20 = 40%

五、利潤率優化

考慮到上述 3 層中每一層都需要保留比較可觀的利潤率,那么針對不同的“用戶”也就可以針對性的采用相應的方案來降低成本。

5.1 個人或小規模初創公司

對于個人或小規模初創公司,可以考慮從直接使用按月付費的應用切換為使用推理服務提供商的 API,然后接入支持自定義 API 的應用或者開源替代,甚至可以考慮自研應用。

當然,直接使用推理服務提供商的 API 也存在一定問題,例如可能帶來額外的模型切換成本。此時也可以考慮 OpenRouter 這類 AI 模型聚合 + API 中介平臺。它類似于 AI 模型的 API 市場,為開發者和用戶提供各種 LLM 的統一入口,用戶通過一個統一的 API,就能調用多個不同廠商的模型,減少開發和切換成本。

OpenRouter 這類平臺主要靠如下幾種模式獲得利潤:

  • API 調用抽成 / 加價(最主要)

對通過平臺調用模型的 API 收取費用,并在推理服務提供商的價格基礎上加價。

允許開發者主動注冊并接入自有模型,平臺提供計費、鑒權等能力,并從其中抽成。

  • 用戶訂閱 / 使用套餐

類似于 OpenAI 的包月服務。

  • 增值服務

比如提供額外的日志、統計分析、鑒權等服務。

5.2 中型公司

對于中等規模的公司,可以考慮進一步跳過推理服務提供商,直接從 Neocloud 廠商租賃 GPU,然后獨立部署相應的模型。當然,這個前提是使用的開源模型或者自研的模型。

針對這個場景,也需要“用戶”儲備相應的 LLM 部署、優化能力,并且購買或者自建相應的依賴組件。

5.3 大型公司

對于大型公司或者有巨大流量的中小型公司,直接跳過上述的 3 層,自建 IDC 必然是最優的選擇,可以直接將成本降到最低。當然,也會帶來額外的負擔:

  • 一次性投入成本大。
  • 相應的人力成本、運維成本增加。
  • 彈性擴展能力降低,比如 Neocloud 上可以快速 Scale-out,而自建 IDC 需要考慮更長遠的規劃。(PS:這也是各大廠既有自用 IDC,又有公有云的一個顯著優勢)
  • 資源利用率低,需要考慮容災,也會有各種各樣的場景,整體資源利用率可能不如預期。

自建 IDC 也有兩種常見的方式,一種是完全自建,還有一種是租用機房并托管自有服務器的方式。

資源利用率可從兩個維度衡量:其一是 GPU 的使用率(例如 GPU Util);其二是算力利用效率(如 Tensor Active 或 MFU 指標)。

    ?六、參考鏈接

  1. ??https://x.com/SemiAnalysis_??

  2. ??https://getdeploying.com/reference/cloud-gpu/nvidia-h100??


本文轉載自??AI閑談????,作者:AI閑談





收藏
回復
舉報
回復
相關推薦
午夜小视频福利在线观看| 欧美日韩国产精品| 91在线视频一区| 精品在线视频免费| 伦理一区二区三区| 色婷婷久久久亚洲一区二区三区| 亚洲人成网站在线播放2019| 国产熟女一区二区丰满| 一区二区三区福利| 最近2019好看的中文字幕免费| 91性高潮久久久久久久| 特黄毛片在线观看| 成人免费小视频| 久久99精品久久久久子伦| 亚洲综合精品国产一区二区三区 | 天堂网avav| 精品资源在线| 91精品国产欧美日韩| 国产肥臀一区二区福利视频| 黄色av电影在线观看| 99久久精品免费| 国产成人亚洲综合91| 久草福利资源在线观看| 久久视频在线观看免费| 久久久久88色偷偷免费| 国产成人综合亚洲| 国产大片aaa| 日本久久综合| 亚洲精品av在线播放| 污污网站在线观看视频| 人人视频精品| 精品av在线播放| 妞干网视频在线观看| 91精品大全| 久久综合一区二区| 国产伦精品一区二区三区在线| 久久发布国产伦子伦精品| 日本综合在线| 国产日产精品1区| 国产日韩欧美在线| 少妇被狂c下部羞羞漫画| 搞黄网站在线看| 国产无一区二区| 欧美日韩国产免费一区二区三区 | 亚洲宅男一区| 亚洲电影免费观看| 亚洲麻豆一区二区三区| 精品一区二区三区免费看| 午夜电影亚洲| 天堂va蜜桃一区二区三区| 色偷偷av一区二区三区| 国产精品果冻传媒| 视频一区在线| 欧美一区二区视频观看视频| 日本一区二区精品视频| 黄色在线观看网| 久久众筹精品私拍模特| 91欧美日韩一区| 中文字幕码精品视频网站| 老牛嫩草一区二区三区日本| 日产精品99久久久久久| 69亚洲精品久久久蜜桃小说| 日韩在线一区二区| 国产精品视频男人的天堂| 中文字幕人妻一区二区在线视频| 欧美aaaaa成人免费观看视频| 国产精品国产亚洲伊人久久| 老熟妇一区二区三区啪啪| 人人爽香蕉精品| 91精品久久久久久久久久入口| 国产精品无码在线播放| 国产精品中文字幕一区二区三区| 亚洲xxx自由成熟| 亚洲第一第二区| av电影天堂一区二区在线| 久中文字幕一区| sese一区| 有坂深雪av一区二区精品| 日本一区午夜艳熟免费| 中文字幕在线免费观看视频| 在线免费精品视频| 国产亚洲天堂网| 色婷婷av在线| 色系网站成人免费| 亚洲精品综合在线观看| swag国产精品一区二区| 亚洲人成绝费网站色www| 欧美成人另类视频| 欧美成人高清| 人体精品一二三区| 一区二区不卡视频在线观看| 国产成人精品免费看| 麻豆91蜜桃| 成人影院在线观看| 欧美日韩性视频| 自拍偷拍一区二区三区四区| 粉嫩久久久久久久极品| 亚洲人成在线观看网站高清| 午夜爽爽爽男女免费观看| 日韩欧国产精品一区综合无码| 欧美日韩免费观看一区三区| 台湾佬美性中文| 偷拍视屏一区| 欧美在线综合视频| 久久精品视频91| 欧美1区2区3| 亚洲人精品午夜在线观看| 91精品少妇一区二区三区蜜桃臀| 欧美偷拍综合| 中文字幕欧美专区| 91看片在线播放| 国产在线视频一区二区三区| 精品一区二区三区国产| av中文天堂在线| 精品国产户外野外| 色视频www在线播放国产成人| 免费在线a视频| 欧美视频在线视频精品| 日韩精品黄色网| 丰满人妻一区二区三区免费视频棣| 天堂成人娱乐在线视频免费播放网站 | 国产丰满美女做爰| 亚洲国产成人在线| 久久精品免费一区二区| 亚洲性视频在线| 久久久成人精品视频| 小泽玛利亚一区二区三区视频| 99久久精品免费看国产 | 欧美一区2区三区4区公司二百| 日韩偷拍自拍| 亚洲尤物视频在线| www.国产福利| 日韩欧美精品综合| 国产成人精品久久二区二区91| 国产 日韩 欧美 综合| 一区在线播放视频| 天天爽人人爽夜夜爽| 蜜桃一区二区三区| 欧美亚洲免费电影| 天天干,夜夜爽| 亚洲国产另类精品专区| av在线天堂网| 国内精品亚洲| 国产区二精品视| 蜜臀av国内免费精品久久久夜夜| 欧美一区二区三区日韩视频| 久久国产波多野结衣| 久久国产综合精品| 中文字幕一区二区三区最新| 国产91欧美| 搡老女人一区二区三区视频tv| 国产偷人爽久久久久久老妇app| 久久久综合视频| 九一精品在线观看| 欧美肉体xxxx裸体137大胆| 国产福利视频一区二区| yiren22亚洲综合伊人22| 欧美亚洲国产一区二区三区va| 亚洲欧美va天堂人熟伦| 免费精品视频在线| 日韩精品视频免费在线观看| 国产成人无码精品| 91亚洲精品一区二区乱码| 蜜桃传媒一区二区三区| 欧美色图婷婷| 欧美sm美女调教| 亚洲成人生活片| 成人在线综合网| 国产v片免费观看| 亚洲精品视频一二三区| 久久免费福利视频| 日韩大胆人体| 欧美日韩一区二区三区在线看| av片在线免费看| 国产麻豆视频一区| 欧美一级免费播放| 亚洲3区在线| 欧美亚洲免费电影| 午夜精品一区| 久久av老司机精品网站导航| 日韩欧美区一区二| 超碰手机在线观看| 国产91色综合久久免费分享| 正在播放久久| 国产精品久久久久av蜜臀| 亚洲欧美综合网| 日韩视频免费中文字幕| 亚洲综合一区中| 亚洲国产精品影院| 成人国产精品久久久网站| 麻豆国产欧美日韩综合精品二区 | 爱爱爱爱免费视频| 亚洲经典三级| 亚洲欧洲日本国产| 国产精品午夜av| 国产精品最新在线观看| av美女在线观看| 在线日韩日本国产亚洲| 亚洲免费成人在线| 欧美色视频一区| 日本天堂网在线观看| 国产欧美1区2区3区| 国产乱淫av麻豆国产免费| 日韩精品三区四区| 成人性免费视频| 99久久精品网| 欧美日本韩国一区二区三区| 美国十次综合久久| 国产成人亚洲综合青青| 岛国毛片av在线| 久久久精品欧美| 久久精品国产亚洲a∨麻豆| 精品国产一区二区三区久久影院 | 久久国产视频一区| 亚洲黄网站在线观看| www.99热| 久久先锋影音av| 在线观看免费视频国产| 韩国一区二区三区| 欧美婷婷精品激情| 欧美一级视频| 久久久久久久午夜| 欧美体内she精视频在线观看| 亚洲午夜精品福利| 久久99蜜桃| 看高清中日韩色视频| 日本a级在线| 欧美日韩国产高清一区二区三区| 国产精品美女久久久久av爽| 一区二区三区在线看| 国产精品www爽爽爽| 99久久99久久精品免费看蜜桃| 国产综合欧美在线看| 99视频这里有精品| 国产有码一区二区| 99精品在免费线偷拍| 国产成人免费av| 欧美va视频| 精品中文字幕在线观看| 国产在线观看a视频| 欧美三级xxx| 九九精品免费视频| 中文字幕一区二区在线观看| 日本视频在线免费| 国产精品丝袜久久久久久app| 2025中文字幕| 国产成人免费视频网站| 日本久久久a级免费| 免费在线观看一级片| 中文字幕在线免费不卡| 美国黄色特级片| 国产福利一区二区三区视频在线| 日韩不卡的av| 狠狠色丁香婷婷综合| 400部精品国偷自产在线观看| 欧美丰满老妇| 日本丰满大乳奶| 中国成人一区| 日本一区二区三区www| 欧美日韩一区二区综合| 一区二区三区四区欧美| 外国成人激情视频| youjizz.com在线观看| 在线不卡视频| 人妻熟女一二三区夜夜爱| 日韩精品久久久久久| av亚洲天堂网| 国产a精品视频| 国产精品一级黄片| 国产欧美日韩精品a在线观看| 亚洲色图27p| 一区二区三区四区不卡在线 | 欧美成人激情免费网| 欧美一级视频免费| 亚洲欧美日韩高清| 求av网址在线观看| 欧美激情视频在线免费观看 欧美视频免费一 | 91av资源网| 蜜臀91精品一区二区三区| 四虎成人在线播放| av福利精品导航| 少妇高潮惨叫久久久久| 亚洲尤物在线视频观看| www.久久精品视频| 欧美一级二级三级乱码| 亚洲欧洲国产综合| 久久精品成人欧美大片古装| 操喷在线视频| 国产免费亚洲高清| 理论片一区二区在线| 亚洲日本精品| 亚洲精品日韩久久| 美女在线视频一区二区| 不卡在线观看av| 长河落日免费高清观看| 亚洲成人一二三| 91精品视频免费在线观看| 精品国产伦一区二区三区免费 | 精品国产乱子伦一区二区| 日韩久久久久久久久久久久久| 伊人久久大香线蕉综合四虎小说 | 高清一区二区| 国产一区二区三区在线免费观看 | www.51色.com| www国产成人免费观看视频 深夜成人网| 妺妺窝人体色www看人体| 国产精品久久久久久麻豆一区软件 | 成年人在线看| 久久精品成人一区二区三区| 香蕉成人av| 国产精品免费一区二区三区在线观看| 欧美日韩激情| 国产精品333| 国产盗摄女厕一区二区三区| 午夜影院免费版| 中文字幕第一区第二区| 青青草av在线播放| 日韩久久久久久| 在线观看日批视频| 亚洲欧美日韩一区二区三区在线| 美女网站视频在线| 成人信息集中地欧美| 日韩欧美在线中字| 精品久久久久久久免费人妻| 国产一区二区亚洲| 欧美日韩美女一区二区| 亚洲综合网av| 中文字幕精品网| 日韩电影免费观看高清完整版| 国产成人啪精品视频免费网| 午夜欧洲一区| 男的插女的下面视频| 日韩在线a电影| av中文字幕免费观看| 精品欧美一区二区三区| 亚洲精选一区二区三区| 久久91亚洲精品中文字幕| 24小时成人在线视频| 在线成人性视频| 麻豆精品视频在线观看视频| 男女男精品视频网站| 欧美在线看片a免费观看| 欧美日韩在线中文字幕| 2019中文在线观看| 亚洲老女人视频免费| 精品国产免费av| 久久影院午夜片一区| 五月天婷婷激情| 亚洲视频日韩精品| 91超碰碰碰碰久久久久久综合| 日韩精品一线二线三线| 奇米影视在线99精品| 少妇高潮惨叫久久久久| 在线综合视频播放| 18视频在线观看| 国产伦一区二区三区色一情| 亚洲一卡久久| 女女互磨互喷水高潮les呻吟 | 久久久久久69| 色婷婷狠狠五月综合天色拍 | 成人国产精品| 中文字幕一区二区三区5566| 国产麻豆成人精品| 日本熟妇成熟毛茸茸| 国产视频久久久久| 成人交换视频| 水蜜桃在线免费观看| 豆国产96在线|亚洲| jizz亚洲少妇| 欧美 日韩 人妻 高清 中文| 国产99精品国产| 久久中文字幕无码| 久久这里只有精品首页| 亚洲大片免费观看| 日韩中文字幕免费视频| 精品麻豆剧传媒av国产九九九| 轻点好疼好大好爽视频| 成人精品免费视频| 尤物视频免费观看| 色99之美女主播在线视频| 91精品入口| 欧美成人免费高清视频| 亚洲欧洲性图库| 免费成人在线看| 国产精品大片wwwwww| 欧美国产91| 真实乱视频国产免费观看| 777午夜精品视频在线播放| 国产直播在线| 宅男av一区二区三区| 成人毛片视频在线观看| 国产精品无码粉嫩小泬| 久久久久久18| 91九色美女在线视频| 91免费福利视频| 亚洲一区自拍| 国产精品视频一区二区三 | 久久99精品久久久久久三级| 日本女优在线视频一区二区| 久久精品性爱视频|