狂拿大模型明星訂單,一家清華系HPC-AI Infra公司浮出水面
不靠囤算力,拿下數家大模型明星公司訂單。
93年創始人掌舵的清華系計算創業公司,有點出其不意。
2023上半年,百模大戰開啟,模型預訓練需求空前爆發,在算力焦慮下,囤積算力成為一種趨同性動作,更充裕的算力幾乎就等于金額更高的訂單。
10億、甚至50億,誘惑非常大。
站在暴風眼最核心,創始人閆博文沒有這么做。從技術角度出發,他知道未來算力一定會有閑置,瘋狂囤算力對于一家技術公司而言似乎也不夠make sense。
而且從結果看,這也不影響他拿大單。百度、Kimi以及視頻生成賽道頂尖玩家生數科技等,都選擇與他們合作。
So,why?
3次獲得戈登·貝爾獎
是石科技創立于2021年,團隊從國家超級計算無錫中心孵化而來,是國內最早將超算智算并行優化的技術進行產業化的團隊之一。
創始人兼董事長閆博文,出生于1993年,畢業于清華大學,是清華計算機系博士后。主要研究方向包括計算機應用技術、高性能計算、并行優化等。
博士期間,閆博文參與了國家超級計算無錫中心項目,主要實現將CFD整體算法移植到國產超算“神威·太湖之光”上。
“神威·太湖之光”,在超算領域這個名字絕不陌生,它是世界上首臺峰值運算性能超過每秒10億億次浮點運算能力的超級計算機,在2016年-2017年連續兩年位居全球TOP500超算榜首。
△ 國家超級計算無錫中心鹽城分中心
它最大的特點是完全使用國產芯片(申威26010)構建,高度異構、并行度極高(>10,000,000核心線程)。由于不同于x86、ARM、CUDA等國際主流計算生態,意味著多數軟件算法都要重寫或者重構。
閆博文主要參與的項目,就是廣泛應用于工業仿真、航空航天、氣候氣象領域的計算流體力學(CFD)算法移植到“神威·太湖之光”上,需要對算法的底層數據結構、并行任務調度、線程級任務劃分、內存訪問策略全部做重新設計。
△國家超級計算無錫中心
這項工作涉及國產芯片、國產算法、國產應用的全流程打通,驗證了國產超算不僅“快”,而且“好用”。
也是這次經歷,讓閆博文看到了國產算力軟硬件適配的需求強烈,產業界對高性能計算、國產可替代的呼聲越來越高,由此成立是石科技。
團隊的核心成員大多來自國家超算無錫中心并行優化團隊,擁有深厚的高性能計算和并行優化背景,曾3次獲得全球高性能計算領域最高獎項——“戈登·貝爾獎”,是國內首個拿下該獎項、也是唯一一個3次獲得該獎項的團隊。
戈登·貝爾獎(Gordon Bell Prize)是高性能計算(HPC)領域的國際最高獎項,被譽為高性能計算應用領域的“諾貝爾獎”,由全球最大的計算機學術組織ACM(國際計算機協會)頒發。
此外,團隊也多次獲得由中國計算機學會(CCF)頒發的“中國版戈登·貝爾獎”——CCF年度最佳應用獎。
如此技術積累下,是石科技在2021年正式成立。
這時,距離ChatGPT誕生不到2年。從時間維度看,是石科技似乎是提前搶占風口,在AI計算需求爆發前完成了底層計算能力構建。
但在當時,業內對于大模型是否應該繼續卷參數規模都還有諸多爭議,沒什么人能預料到后來ChatGPT引爆的趨勢,更別提背后的AI大規模計算需求,熱度遠不及當下。
說是石預判了AI趨勢,確實不合理……但如果不是對趨勢有預估,為何它能穩穩承接突然爆發的AI計算需求,并不斷拿大單?
創始人閆博文似乎并不覺得這應該是個問題,因為:
無論大模型爆不爆發,我們都一定會長期從事高性能計算這一行。
不是什么火就做什么,始終從計算維度做判斷
如此判斷,有來自實際需求、國家戰略的影響,當然也有源自技術公司長期主義的思考。
時間回到2021年,高性能計算產業本身的風口更早浮現。
國家戰略方面,2020年“新基建”被首次寫入政府工作報告,算力與AI被明確列為重點方向。2021年《“十四五”數字經濟發展規劃》中,算力建設作為數字經濟發展的核心基礎設施,被明確納入國家戰略。中國高端算力也被列入“戰略資源”。
這個時間節點很像互聯網爆發前期。2000年左右,寬帶、服務器、CDN的基礎設施鋪好后,才有了新浪、百度、阿里、騰訊的起飛。2021年的高性能計算,正處于同樣的拐點。
更何況產業側本身的需求也很明顯。閆博文提到,當時已經在科研、工業等領域看到了對大規模數值模擬的強烈需求。同時也觀察到國內在算力平臺建設方面還處于早期,企業缺乏算力供應,也缺乏專業團隊維護——供需不平衡的問題亟需解決,需要有專業團隊來調節這一問題。
由此,是石科技成立。要做的事就兩件:
- 提高計算效率
- 降低計算成本
核心業務是IaaS和模型專家模型服務。

△是石科技核心業務
核心技術是并行計算,這其中包括對計算系統中計算、存儲、網絡等方面的一系列優化,CPU、GPU異構計算的調配;本質上是通過軟硬結合讓用戶的算法以最適配的方式規模化部署在硬件上。
在創立早期,是石就構建了包括超算和智算在內的底層算力,并向上搭建算力調度平臺、Infra優化框架以及應用服務在內的全棧能力。目前已構建起HAI統一計算平臺。
△ 是石科技HAI統一計算平臺
- 算力層:管理約10余個智算中心和2個國家級超算中心/訓練場,總算力規模超過10000PFlops。其中:鹽城超級計算中心獲批 “國家新一代人工智能公共算力創新平臺”;是石科技總部落戶浙江平湖市,并建成超智融合計算平臺;北京經開區模數世界成立是石科技模型調優工廠。
- HAI框架層:提供支持多種型號CPU和GPU的算力調度、納管,訓練+推理的一體化平臺,以及AI算子庫和行業算子庫的深度優化庫環境。服務超過20余個應用領域,200多項應用課題,200萬個作業任務,HAI框架經多場景落地驗證的部署、調度與優化能力得到眾多用戶認可。
- 模型層:提供基礎模型優化和行業專家模型優化訓練推理服務,專家模型覆蓋高端制造、生物醫藥、醫療健康等領域。

△是石科技行業專家模型服務
在此技術棧基礎上,大模型趨勢爆發,把是石更進一步推向臺前。
從2023年到現在,AI計算需求大、而且變化快。無論是基礎模型廠商,還是有AI模型訓推的企業,都需要有更專業的團隊為其優化算法與算力配置。
在這之中,是石科技為月之暗面、生數科技、瑞萊智慧、愛詩科技、云道智造等頭部企業,以及清華大學、北京大學、香港科技大學等頭部高校,均提供了算力及優化服務,且不同領域客戶面對的挑戰不盡相同。

△是石科技HAI平臺運行結果
比如視頻生成方面,文生視頻、圖生視頻…不同任務的計算需求不同,在底層算力上也要做好劃分,這就更考驗對計算本身的理解,使用CPU、GPU還是異構計算?不同類型計算配比如何?怎樣能盡可能降低通道擁堵?越是細節的問題,就越考驗運維團隊的功力。
以及視頻任務本身就更“燒卡”,對成本考驗更大。如何為客戶優化算力構成,讓同一任務以相同的完成度跑在更低配置的卡上,也是對團隊優化能力的考驗。
據閆博文透露,是石科技在過去2年陪伴多家基礎模型公司走完模型訓練、推理等階段,推動其基礎模型快速上線、以及對外提供穩定優質服務。
另外在大模型垂直領域研發上,是石科技也為高校科研團隊、企業提供底層計算優化服務。是石科技攜手深圳大學大數據國家工程實驗室、南方科技大學風險分析預測與管控研究院、深圳市淵維科技有限公司發布財務風險預警推理一體機,基于推理大模型與財務專家經驗,為投資機構與個人客戶提供高效的風險預警解決方案。
目前,是石科技的業務占比中,AI計算帶來的營收占比超過50%,特點是大單多。與之對應,科學計算領域的訂單則呈現出“客戶多”的特點,當下也依舊是是石科技業務的主要構成部分。
在閆博文看來,雖然科學計算不是新風口,但是它的算力需求更剛性、更結構化,比如工業模擬仿真、氣象預測等領域。
有時候一個仿真系統的物理時間要求是幾秒鐘,它背后的模型計算量是數十倍于普通AI推理的。
如今隨著AI大火,科學計算也與AI進一步融合。比如在航空航天領域,既需要上千核并行的仿真程序,也需要跑神經網絡的AI模型。
總之,作為計算優化領域的資深玩家,是石判斷做什么、不做什么,更多是從計算本身的需要出發,而不是簡單跟隨趨勢。
但這其實要求自身對行業有深刻理解,要知道這兩年算力行業的變化瞬息萬變,趨勢預估變得更加困難,甚至充滿誘惑。
比如開頭提到的,閆博文從算力供需平衡的角度出發,認為公司已經沒必要囤算力,后續可以依靠調度閑置算力服務客戶。但這就意味著,他們不僅要頂住巨大算力焦慮,也要頂住數十家算力中心的前置簽約誘惑。
從一個創業公司角度,擺過來一個10億、甚至50億的訂單,誘惑力非常大,但它也可能是個糖衣炮彈。
那么閆博文的判斷邏輯是什么?
2023年國家新一代人工智能公共算力平臺建成、上千家算力中心或建成或在規劃中,這意味著算力緊張只是暫時的,未來一定存在大量閑置算力。如果參與了這場“囤積算力”的豪賭,一旦沒有把握時機,很可能在供需快速變化中面臨虧本。
因為算力的折舊是非常快的,一旦事先囤積、發生空置,就有成本損耗,而且是白白浪費。如果一年之中空置了一個月,相當于這一年都白干了。
如今在2025年回看,這種判斷正確且理性。雖然摩爾定律開始失效,但是“老黃定律”出現,底層芯片的供應并沒有預料中如此嚴峻。同時國產算力再進一步跟上,為市場提供更豐富選擇。
當然,這種判斷也一定不只依賴于技術認知,還有個人風格影響。
畢竟大模型趨勢如火如荼,不是誰都能克制且不焦慮的。
93年創始人帶隊,松弛感十足
由93年創始人掌舵的是石,整體團隊都相當年輕,團隊成員中60%的90后,20%的00后。
年輕的好處,就是不容易內耗。上億的訂單做不做,一天內即可決策出來。
這種不內耗,在閆博文身上更明顯。
技術趨勢演進如此快,獨角獸林立、入場玩家越來越多,大家都擔心自己掉隊或者沒能乘上時代的東風。
我們問,介意行業出現更多競爭玩家嗎?
閆博文:不介意,玩家越多市場越大。
也不焦慮?
閆博文:不焦慮。我們目前就是在有限范圍內擴張和投入,不寄希望于投入10個億下去,做個標準化產品出來,然后大家就都用起來了。這事和我們預判到的技術路線相違背。
那是石科技看到的技術趨勢是什么?
越優化的東西,通用性越差。
看似悖論,實則道出計算領域長期存在的一個結構性張力:性能vs通用性。
比如針對某個任務/芯片/模型深度定制,如CUDA kernel手寫、硬件深度綁定、數據布局精調,性能爆炸性提升,但很難遷移到其他任務或平臺;如果是PyTorch這類通用接口,適配范圍廣,開發效率高,但犧牲性能、調度、資源利用率。
對于正在爆發的算力領域,也將遵循這一規律,逐漸從通用計算走向場景計算。
閆博文認為,未來的計算中心將不再以地區作為劃分依據,而更應該是某個計算中心集中處理某一類計算任務,類似于專攻某一場景。這樣能集中做優化,也能進一步提高算力資源利用率。
這種思想在是石的產品中亦有體現,在模型服務劃分上,團隊也遵循以場景作為分類標準。
而對于行業來說,真正的挑戰是:如何在通用與優化之間找到“高效、可復制、快速定制”的平衡點。行業距離抵達這樣的終點,還有很長的路要走。
換言之,在算力領域,貪圖一時的快速擴張可能會違背行業發展規律。選擇以慢打快,焦慮自然也不存在。
長遠來看,是石科技則希望未來作為用算力賦能各行各業的代表,也能打出類似“Made in China”的影響力——Powered by METASTONE是石,這是對未來愿景的終極暢想。
回歸當下,是石科技要做的就是為客戶提供好算力與模型優化服務,進一步提高效率優化成本。
今年,一直沉于水面之下的是石科技開始更多對外亮相。在剛剛落幕的WAIC 2025大會上,是石科技團隊也做了進一步分享;同時,新的標準化產品即將發布、新一輪融資也正在籌備中,可以說是技術儲備的一次大釋放。
所以,在AI爆發的趨勢里,哪有什么“小荷才露尖尖角”,更多都是“早有蜻蜓立上頭”。
你覺得呢?
One More Thing
最后,如果一定要問,當boss有什么焦慮點。
閆博文也相當坦誠:
焦慮客戶滿不滿意、擔心成員吵不吵架、錢夠不夠用…
嗯,果然是90、00后為主的團隊,就是有啥都不掖著




























