微軟公開AI基礎設施服務 代號:Singularity
微軟Azure和研究院團隊正在合作開發一項新的AI基礎設施服務,代號為“Singularity”。根據微軟發布的部分招聘內容來看,Singularity團隊正在努力構建微軟所謂“全新的人工智能平臺服務,將成為微軟內部和外部人工智能的主要驅動力”。
該項目的成員發表了一篇題為“Singularity: Planet-Scale, Preemptible and Elastic Scheduling of AI Workloads”的論文,其中提供了關于Singularity項目的技術細節。Singularity服務旨在為數據科學家和AI從業者提供了一種方法,讓他們可以在微軟專為AI打造的分布式基礎設施服務上構建、擴展、試驗和迭代他們的模型。
這篇最近發布的發表論文,作者名單中包括Azure首席技術官Mark Russinovich;合作伙伴架構師Rimma Nehme,曾在Azure Cosmos DB工作,直到2019年轉到Azure從事AI和深度學習方面的工作;以及技術研究員Dharma Shukla。根據這篇論文:
“Singularity的核心是一個新穎的、工作負載感知的調度程序,可以透明地提前搶占和彈性擴展深度學習工作負載,在不影響正確性或者性能水平的情況下,在全局加速器(例如GPU、FPGA)中提高利用率。”
微軟方面此前曾討論過將FPGA作為服務提供給客戶的計劃。2018年微軟公開了代號“Project Brainwave”的項目,該項目旨在通過Azure提供快速AI處理能力。當時,微軟預覽了一個由Brainwave支持的Azure Machine Learning Hardware Accelerated Models,這也是微軟在為客戶提供用于AI工作負載的FPGA處理能力方面邁出的第一步。
我猜測,Singularity是微軟把Brainwave轉化為商業服務邁出的下一步,我已經向微軟方面提出詢問對此發表評論。我還詢問過微軟計劃何時以及如何將Singularity轉化為商業服務。
2019年,微軟宣布在OpenAI上投資10億美元,一年后微軟宣布,已經與OpenAI合作并專門為OpenAI打造了全球第五大超級計算機。
雖然這款AI超級計算機是微軟專為OpenAI打造的,但微軟一直表示,將會通過Azure AI服務和GitHub提供微軟大型AI模型和訓練優化工具。此外微軟還通過Azure AI為那些不需要專用超級計算機的客戶提供各種加速器和服務。2021年11月,微軟宣布將在Azure 中采用80GB NVIDIA A100 GPU擴展他們的AI超級計算機陣容。
大家可能還記得,此前微軟曾把Singularity用作另一個研究項目的代號,當時這是一個微內核操作系統以及一組完全以托管代碼開發的相關工具和庫。這個Singularity并非基于Windows,而是作為概念驗證從零開始編寫的。Singularity最終催生以及/或者影響了微軟其他幾個操作系統研究項目,包括Barrelfish、Helios、Midori和Drawbridge。
另外值得注意的是,微軟并不是唯一一家試圖在自己內部和客戶之間提供人工智能超級計算功能的科技公司。Meta也在做同樣的事情,并且已經將其作為解鎖元宇宙的一把鑰匙。





























