通威股份CIO周勇:低成本、普適性的云容災成為可能
原創【51CTO.com原創稿件】時隔三年,再見通威股份有限公司CIO周勇,是在位于成都的通威總部,現代化的辦公環境,富有科技感的IT創新體驗中心,都給筆者留下了深刻印象。在周勇的引導下,筆者參觀了通威的信息化展廳以及先進的私有云機房,切身地感受了信息化建設給通威帶來的巨大變革。
回顧三年前,彼時的通威正在邁開IT轉型的步伐,建設集中一體化運營的ERP系統,建立通心粉社區,打造全球水產人的網上家園,建立通威智能水產養殖系統實現智能養殖,以私有云為架構建立FBC融合業務云平臺開啟云化轉型,這一系列的信息化建設舉措為通威業務的快速發展夯實了基礎。
通威股份有限公司CIO周勇
通威股份是較早一批采用統一通訊系統的企業,目前已更新至第三代云視頻會議系統,企業內部跨地域、跨國之間的視頻會議均免費,內部溝通與協作十分高效。此外,通威已完成SRM供應商&協同管理系統,HRM人力資源管理系統,決策分析BI系統等信息化建設工作,為助力集團業務發展,促進管理提升打下了良好基礎。
借助先進的技術平臺和管理思想,通威構建了面向未來的數字神經網絡,這讓通威更具競爭力,與此同時,業務對IT的重度依賴,也讓周勇身上的負擔越來越重。通威的私有云數據中心采用了雙電源、三條互聯網線路,通威大樓也配備發電機,周勇提到:“雖然我們的私有云數據中心非常先進,但是隨著業務對IT的依賴度越來越高,一旦機房、網絡出現問題,一個電話都打不出去,對業務造成的影響更是無法估量,IT團隊時刻處于提心吊膽的狀態。”
從隱患存在到事故發生只需要一根引線,有一年9月底,由于光纖被挖斷,通威當天要進行月度結算,數據中心的運算量非常大,如果不能快速修復,對于已經上市的通威來說可能造成較高的收入結算影響。這樣的后果顯然不是IT團隊能承擔的,還好當天事故得以快速解決,沒有造成嚴重的后果,但是這樣玩心跳的狀態顯然不是周勇想要的。
公有云容災方案初探
要想保證私有云上IT系統的穩定性和連續性,容災模式是必然選擇。對于像通威這樣以農業為主的傳統企業來說,99%以上的企業都沒有做容災,成本太高、技術難度大、建設周期長、管理維護復雜、擴展性差是主要原因。
傳統容災不可取,周勇很快想到用公有云環境做容災的可行性,這是公有云的創新應用,可參考的案例非常少,合作伙伴的選擇更需謹慎。另外,公有云容災涉及到將傳統核心系統向公有云遷移的問題,受傳統IT架構的影響,數據上云容易,要想保證公有云和本地數據中心的數據同步卻是一個很大的難題。
經過慎重的綜合考察,通威選擇與AWS及AWS高級咨詢合作伙伴四川知行志成科技有限公司共同探索公有云容災方案。提及選擇AWS的原因,周勇認為主要有三個理由:一是AWS在全球云計算領域領軍者的地位;二是AWS在中國擁有大量的實踐案例,也有中國本地的數據中心,業務與支撐服務發展狀態良好;三是AWS對創新項目的支持非常給力,雙方在背后均付出了大量的努力。
云遷移的思路,一般都是從簡單應用開始,通威則恰恰相反。在周勇看來,與其對HR等獨立性較強、集成度較低的單個系統做容災測試,不如直接做復雜核心系統的容災,因為核心系統的容災對企業來說更有價值,對企業業務的影響更大。
“坦率地說,AWS開始做我們的項目,也不一定非常有底。”周勇如是說:“基于IaaS環境做容災,遷移到云上沒有問題,但是我們選了FBC融合業務云平臺這個復雜的核心系統來做,所以他們也不是很有底,但是他們做到了,而且做成了一個非常好的方案和服務。”
FBC融合業務云平臺的復雜度在于它是一個應用集,包含了門戶、BPM(流程管理)、身份管理、BI、SLA、EBS(企業服務總線)、知識管理等各類應用。FBC與三十余個系統集成,是通威當之無愧的核心系統,與之有關聯的接口多達500余個。FBC一旦出現問題,所有的業務系統可能都會受其影響,對FBC進行云容災,風險和難度可想而知。
周勇回憶,通威云容災項目從2018年6月開始進行技術方案測試,到2018年10月,云上、云下遷移的技術方案已全部完成測試驗證。在隨后的一年里,通威一方面進行AWS技術認證,另一方面針對非云架構的自有系統,進行改造和解耦來適應云架構,解決數據傳輸速度和效率問題的同時,也攻克了多用戶在云上運行效率的難關。
普適性、低成本的云容災成為可能
值得一提的是,2019年6月份,通威遇到了云容災項目中的一大瓶頸,那就是大量數據交互的問題。系統和接口的改造帶來了集成方式和網絡環境的變化,同時也會帶來效率、集成和速度方面的問題。通威的本地數據中心用的是雙路光纖、萬兆光纖通信,系統和數據放在云上,傳輸效率是否會大打折扣是周勇非常擔心的問題。經過對比測試后發現,在云上用500 Mbps與本地的萬兆光纖進行數據傳輸,足以滿足業務的訪問需求,隨后項目團隊又測試了200 Mbps的云上傳出方案,也足以支撐實際生產環境中數據交換集成對網絡環境的要求。至此,通威打通了私有云數據中心與AWS公有云之間的通路,其核心應用FBC系統成功在AWS云上實現容災,形成了具有安全性、高可用、可擴展的混合云架構。
通威混合云容災備份架構圖
在筆者看來,周勇是一個懷揣夢想、勇于探索的實干家。以往容災只有銀行、證券等金融行業的大企業才做的起,通威云容災項目的初衷是打造一個低成本的容災項目,讓中國企業不會在談到容災時因為技術和成本問題望而卻步。通威FBC平臺云容災項目的順利交付,不僅成就了通威、AWS以及知行志成三方,也給傳統企業進行云容災開辟出了一條通路。周勇強調:“200 Mbps意味著什么?意味著這是一款云上災備的普適性、低成本的方案,這個項目做完了,中國企業的傳統數據中心在云上做災備,沒有做不成的。”
為了降低項目的總體成本,實現云容災的普適性,通威與AWS進行了多次嘗試。一是更換了項目災備軟件中核心的VRP(通用路由平臺),將VRP的成本降到很低的水平;二是考慮到云上資源的占用差異,將業務中斷時間設置為30分鐘,在節約成本的同時,30分鐘內就可以切換到云上,快速恢復核心業務,解決了IT的核心問題。另外,云上的服務器無需開機,企業只需支付日常的存儲費用,只有在異常事件發生需要啟動云容災時才會開機,因此可以將容災費用降低至十分之一、百分之一甚至更低水平。
當前,中國的大部分企業都處于輕基礎架構、重應用的狀態,因此企業需要一個龐大的IT團隊去維護基礎架構。通威云容災項目的另一個核心價值,在于能將IT團隊從復雜、繁瑣的運維管理工作中解放出來,有更多的時間和精力去關注業務和創新,為企業的IT轉型提供更重要的支撐。
探索未來
將FBC系統遷移至公有云只是通威云容災的初步探索,接下來周勇期望繼續探索企業上云路徑,將ERP以外的系統全部在云上做災備,嘗試將公有云作為主環境,用本地數據中心做備份環境,甚至不再擴建本地數據中心,而是采用多云數據災備的形式,在保障企業已有IT投入的同時,能夠跟上技術發展的潮流。
未來,通威IT團隊將在三個方面繼續發力,一是通過數字中臺實現前端業務的轉型創新,二是探索混合云建設路徑,三是摸索提高IT團隊響應效率的管理方法,如流程驅動、敏捷開發模式,DevOps及IT運維轉型等。通威IT團隊將通過以上三種途徑,助力通威提升數字化競爭力,加快數字化轉型進程。
【51CTO原創稿件,合作站點轉載請注明原文作者和出處為51CTO.com】























