云上貴州:基于鯤鵬DevKit快速開發智能運維平臺,性能提升75%?
?行業IT數字化轉型方興未艾,區塊鏈、虛擬化、容器、IoT等新技術的應用使得業務模式產生了巨大的變化,IT運維也隨之迎來了更高的要求:運維規模更龐大、運維對象更豐富、運維要求也越來越高,以上種種都給傳統運維方式帶來巨大挑戰:
- 被動低效的運維難以保證業務連續性:傳統運維多依賴專家的經驗規則進行故障定位、根因分析和配置下發等管理任務的制定和執行,運維人員往往扮演著事后“救火”的角色;?
- 運維方式分散:運維的自動化程度較低,缺乏統一的運維監控體系和技術工具,效率低下;?
- 海量的運維數據的價值無法充分挖掘:傳統運維系統收集了大量的運維數據,但是卻缺乏有效的手段加以分析和利用。?
針對傳統運維中存在的痛點,覆蓋新技術、新場景和新應用的運維創新是面向未來的必然選擇,而由大數據、人工智能、機器學習技術交叉而形成的智能運維(AIOps)行業逐漸成為一片新藍海,吸引各地政府、企業開展廣泛布局并積極探索行業應用,也推動了自動化運維工具的進一步發展。?
云上貴州大數據產業發展有限公司(以下簡稱:云上貴州)成立于2014年,致力于推動??大數據????電子信息產業??發展。通過全方位的大數據??基礎設施??、數據處理與存儲、數據挖掘與交易、信息系統集成服務和專業的云平臺及云??應用等服務??,為政府和企事業單位提供云計算、云儲存、數據庫、云安全及數據共享開放等服務,構建大數據產融生態體系。?
云上貴州在智能運維領域深耕多年,其自主研發的智能運維平臺,通過本地或遠程采控的方式實現對終端及云平臺等新型設備資產的管理監控、運維團隊的統籌管理、運維數據的采集沉淀與挖掘,為用戶提供全流程智能化的IT運維服務,助力企業運維進入智能化時代。?
伴隨著數據的爆炸性增長及技術快速的迭代升級,運維團隊需要計算效率更快、數據處理效率及工程效率更高的自動化平臺,從而更好地支撐端到端的運維保障服務,因此對運維平臺的算力底座提出了更高挑戰:?
1.高吞吐:運維服務熱線、設備運行狀態數據采集等大批量數據操作要求滿足大并行計算且快速處理的要求。如某政務場景中涉及約10萬臺新型終端,除運維團隊支撐外,預計每天有幾百上千次用戶咨詢或服務請求。?
2.低延時:為提供工程師遠程運維能力和用戶服務體驗,平臺對數據和網絡延時有很高要求,客服機器人回答問題時間從過去的3-4s縮短到1s。?
3.高可靠:云上貴州智能運維平臺是構建統一運維服務體系的核心支撐,服務區域乃至貴州省運維工作的統籌管理,因此對可靠性要求極高。?
4.低功耗:運維服務體系將會是一個長期、高頻、重度使用的業務體系,大規模的計算量將帶來了能耗提升,為響應國家環保號召,需要低功耗硬件實現節能減排。?
鯤鵬天然的多核多并發的擴展運行能力,以及高性能、高算力、低功耗等優勢,能夠很好的滿足云上貴州智能運維平臺海量數據處理、低時延、高可靠及綠色計算等要求,同時還提供完善的鯤鵬DevKit開發套件以及專業服務,能夠幫助用戶快速完成應用的遷移、開發、編譯和調優;此外,結合鯤鵬BoostKit還可在HTTPS訪問以及應用安全性上實現進一步提升,助力智能運維平臺的高效創新。?
基于上述考慮,云上貴州選擇鯤鵬作為云上貴州智能運維平臺的數字底座,通過軟硬件相結合的方式,實現面向用戶的智能化及全流程運維服務,提供涵蓋云、網、端全面的運維保障服務。?

【云上貴州智能運維平臺全棧圖】?
鯤鵬DevKit 1人天/應用快速遷移云上貴州智能運維平臺?
項目初期,由于生態架構差異,開發人員需要將云上貴州智能運維平臺快速遷移到鯤鵬平臺并進行兼容適配,由于業務系統體量巨大、代碼復雜,需要對3個業務子系統,10個功能模塊進行遷移,平臺依賴包含約600個,通過人工無法快速精準進行兼容性評估,編譯效率太低。?
鯤鵬開發套件DevKit提供鯤鵬代碼遷移工具,能夠對工程文件進行掃描分析,自動識別待遷移代碼并給出代碼修改建議,在工具的幫助下共識別出可兼容替換jar包29個,同時還快速獲取了兼容依賴庫的下載地址,平均1人天/應用就完成了業務系統的遷移,極大縮短應用遷移的時長和提高遷移的有效性。?

【鯤鵬DevKit代碼遷移工具掃描獲取遷移報告-以客服模塊為例】?
基于鯤鵬DevKit高效開發ITSM管理模塊,性能提升75%?
針對大體量客戶的運維服務需求,遷移完成之后,云上貴州計劃在鯤鵬服務器上開發ITSM(IT Service Manager)管理模塊以實現更高的運行效率。ITSM系統是云上貴州智能運維平臺核心業務層的重要模塊,為工程師提供工單管理和流轉的支持服務,確保技術支持服務能夠有序可控且高質量的執行。?
在開發過程中,為進一步提升業務與鯤鵬平臺的兼容性和穩定性,將之前的OpenJDK替換為鯤鵬DevKit提供的畢NJDK,畢NJDK在鯤鵬架構中為云上貴州智能運維平臺提供了更好的兼容性和穩定性,編譯性能較之前使用的OpenJDK8有了大幅提升。?
此外,針對系統出現的性能瓶頸,技術人員使用鯤鵬DevKit性能分析工具對應用進行性能調優和系統診斷,從而幫助技術人員更加快速找到熱點問題和定位性能瓶頸:?
- 針對客服模塊工單處理場景進行性能優化時,通過鯤鵬DevKit系統性能分析功能發現Docker和Nginx等服務進程上存在熱點的問題,在工具的幫助下調整了Docker-Compose中物理資源分配策略,調整了Nginx中worker_processes、proxy、multi_accept等參數,從而優化了數據的并發特性;?
- 同時,鯤鵬DevKit調優助手可以快速分析出系統資源消耗鏈條,引導技術人員分析性能瓶頸,在工具的引導下發現php-fmp(PHP FastCGI 進程管理器)存在性能瓶頸,結合工具的修改建議,對pm、pm.start_servers、pm.max_children等參數項進行優化,大大減少了系統中斷頻率和服務響應時間,使得工單處理等業務響應時間由375ms縮短到了220ms,提升了設備處理能力。?

【單次業務響應時間和200并發業務場景吞吐量性能調優前后對比】?
通過鯤鵬DevKit進行編譯優化及性能調優之后,云上貴州智能運維平臺的整體性能都得到了提升:在操作工單的業務場景中,8w數據規模下單次業務響應時間由375ms縮短到220ms,性能提升41%; 200并發同時處理工單的場景中,吞吐量由每秒114.7次提升到了202.7次,業務性能提升可達75%。此外,一鍵幫助等業務的綜合性能也得到較為明顯的提升。?
在進行云上貴州智能運維平臺的鯤鵬原生開發過程中,通過鯤鵬DevKit提升了應用開發和遷移效率,有效提升了加解密算法的處理速度,使得整個運維保障服務進一步實現降本增效的目標,讓政府及企業的運維統籌工作更加便捷和高效。?
目前云上貴州智能運維平臺已正式上線,面向貴州全省提供服務保障工作,已經成功支撐貴州省多項重要民生服務。該方案也在鯤鵬應用創新大賽2022貴州賽區數字政府賽道獲得了金獎榮譽。這不僅驗證了該平臺與鯤鵬結合后高性能、高可靠的優勢,也標志著云上貴州產品在鯤鵬計算應用創新、產業融合、市場應用方面達到領先水平。?
作為鯤鵬計算產業生態重要伙伴,云上貴州已與鯤鵬生態創新中心建立長期合作關系。未來,鯤鵬將持續通過最新的技術使能伙伴聯合創新,打造更具競爭力的行業解決方案,支撐數字貴州建設,促進千行百業數字化轉型。?
鯤鵬原生開發是指使用鯤鵬DevKit的原生開發能力,如鯤鵬開發框架(含場景化SDK)、編譯調試工具、云測服務、調優&診斷工具等,在鯤鵬平臺上開發新軟件/新功能,充分發揮鯤鵬架構優勢,從而獲得開發效率/運行性能提升。鯤鵬DevKit將持續增強開發體驗、優化工具能力,提升鯤鵬開發效率,助力千行百業數字化轉型。?
































