淺談SDN架構(gòu)下的運(yùn)維
目前國(guó)內(nèi)的網(wǎng)絡(luò)運(yùn)維還處于初級(jí)階段,工作人員每天就像救火一樣,天天疲于奔命。“什么破網(wǎng)絡(luò)怎么又?jǐn)嗔?rdquo;,“我去,服務(wù)器宕機(jī)啊”,“這個(gè)網(wǎng)速慢的跟烏龜爬的一樣”,這些埋怨聲每天都在運(yùn)維人員耳邊回蕩。運(yùn)維人員只能埋頭查找系統(tǒng)運(yùn)行的日志,耗時(shí)耗力,老眼昏花不說(shuō),有時(shí)候忙了半天還一無(wú)所獲,作為運(yùn)維工程師的你,有木有遇到過(guò)類(lèi)似苦逼的經(jīng)歷?
傳統(tǒng)網(wǎng)絡(luò)的運(yùn)維痛點(diǎn)
傳統(tǒng)的網(wǎng)絡(luò)運(yùn)維每天都是針對(duì)不同的廠商設(shè)備敲不同的命令行,從 Cisco、Juniper、到華為、華三,變化的只是換一種命令show / display 、no/undo。網(wǎng)絡(luò)管理分散,網(wǎng)絡(luò)和云管平臺(tái)、安全、IT/業(yè)務(wù)系統(tǒng)互相獨(dú)立,需要分別維護(hù),效率低;網(wǎng)絡(luò)結(jié)構(gòu),配置、拓?fù)洹㈡溌窢顟B(tài)的不可視化,運(yùn)維人員只能依賴(lài)經(jīng)驗(yàn)和記憶,變更調(diào)整網(wǎng)絡(luò),這為網(wǎng)絡(luò)留下了大量隱患;管理模式單一,基于單設(shè)備或單機(jī)架構(gòu)管理,錯(cuò)漏多、排障難等等。當(dāng)網(wǎng)絡(luò)出現(xiàn)問(wèn)題時(shí),公司的各個(gè)大小部門(mén)都在埋怨運(yùn)維部門(mén),可是運(yùn)維人員也很無(wú)辜,每天面對(duì)繁雜的工作不說(shuō),最后出了問(wèn)題也只能“打碎牙齒和著血往肚子里面咽”,成了名符其實(shí)的“背鍋俠”。
運(yùn)維部門(mén)每天都要制定不同的規(guī)章制度,較大規(guī)模的公司會(huì)有自己的開(kāi)發(fā)人員對(duì)開(kāi)源軟件和開(kāi)源產(chǎn)品做二次開(kāi)發(fā)。在傳統(tǒng)的網(wǎng)絡(luò)中,隨著企業(yè)業(yè)務(wù)上漲,該公司的網(wǎng)絡(luò)運(yùn)維部門(mén)規(guī)模也會(huì)跟著擴(kuò)大。一個(gè)典型的網(wǎng)絡(luò)運(yùn)維部門(mén),開(kāi)始團(tuán)隊(duì)只有十幾人,當(dāng)四五年后,業(yè)務(wù)系統(tǒng)變得復(fù)雜,網(wǎng)絡(luò)設(shè)備涉及的種類(lèi)越來(lái)越多,運(yùn)維人員也越來(lái)越多,基本翻了兩倍。他們每天都需要7*24小時(shí)值班,哪怕是已經(jīng)下班回家的工作人員也是手機(jī)不離身。處理舊的故障時(shí)會(huì)有故障模板。當(dāng)遇到新的故障時(shí),除了要辛辛苦苦找方法解決,最后還要再寫(xiě)新的故障模板。于是,運(yùn)維人員的故障模板庫(kù)越來(lái)越來(lái)越長(zhǎng),越來(lái)越復(fù)雜。然只能?chē)@息“吾心甚累!”
網(wǎng)絡(luò)的發(fā)展
網(wǎng)絡(luò)在發(fā)生什么樣的變化?我們只能看到網(wǎng)絡(luò)的變化,才能看到網(wǎng)絡(luò)運(yùn)維需要對(duì)應(yīng)做什么變化。
從1974年TCP/IP協(xié)議的發(fā)布,到今天的SDN,網(wǎng)絡(luò)技術(shù)一直在發(fā)展。在這期間產(chǎn)生了快速以太網(wǎng)、MPLS、SDN技術(shù)、Openflow 1.0以及后續(xù)的版本、Open Daylight的發(fā)布等,促進(jìn)了網(wǎng)絡(luò)的發(fā)展。
20世紀(jì)60年代,很多大學(xué)和研究機(jī)構(gòu)都在致力于新的通信技術(shù),其中有一家美國(guó)國(guó)防部最為突出,當(dāng)時(shí)為實(shí)現(xiàn)迂回的通信傳輸方式,分組交換方式便應(yīng)運(yùn)而生了。到20世紀(jì)60年代下半葉,已有大量的人員投入分組交換和分組通信的研究中。后來(lái)為給互聯(lián)計(jì)算機(jī)中提供可靠的通信,到1982年全球性的組織提出了TCP/IP協(xié)規(guī)范,1990年左右不論是局域網(wǎng)還是廣域網(wǎng),都開(kāi)始傾向TCP/IP協(xié)議。
互聯(lián)網(wǎng)投入商用是從1995年開(kāi)始,當(dāng)時(shí)互聯(lián)網(wǎng)服務(wù)供應(yīng)商數(shù)目劇增,1996年IPv6規(guī)范出爐,載入RFC。
1995年開(kāi)始做快速以太網(wǎng)標(biāo)準(zhǔn),1997年IETF成立MPLS工作組。2005年中國(guó)出現(xiàn)了電信級(jí)以太網(wǎng)概念,同年,全球骨干網(wǎng)絡(luò)基礎(chǔ)建設(shè)大規(guī)模興起。
2006年了SDN 誕生,從誕生至今,在中國(guó)商用落地的項(xiàng)目并不多。2009年的時(shí)候,Openflow1.0 正式發(fā)布,在全球掀起了一陣風(fēng)潮,大家開(kāi)始意識(shí)到網(wǎng)絡(luò)要改變了。2011年開(kāi)始 ONF 的成立又掀起另一股浪潮。2012年谷歌B4全面運(yùn)行,2013年 OpenDaylight 發(fā)布,2014年 ONOS 發(fā)布。各行各業(yè)的玩家開(kāi)始進(jìn)入SDN領(lǐng)域。
那SDN是什么
SDN是Software Defined Network的縮寫(xiě),也就是軟件定義網(wǎng)絡(luò)。SDN是一種網(wǎng)絡(luò)架構(gòu),將網(wǎng)絡(luò)的控制平面與轉(zhuǎn)發(fā)平面分離,并通過(guò)開(kāi)放和可編程接口直接對(duì)控制平面進(jìn)行編程。SDN的核心理念就是希望通過(guò)應(yīng)用程序來(lái)控制轉(zhuǎn)發(fā)行為,完全通過(guò)軟件來(lái)定義整個(gè)網(wǎng)絡(luò)。
SDN架構(gòu)分為應(yīng)用層,控制層和基礎(chǔ)設(shè)施層:
- 應(yīng)用層包括各種不同的業(yè)務(wù)和應(yīng)用,負(fù)責(zé)各種網(wǎng)絡(luò)資源的編排;
- 控制層也就是SDN的控制軟件,負(fù)責(zé)處理各種數(shù)據(jù)轉(zhuǎn)發(fā)資源,維護(hù)網(wǎng)絡(luò)拓?fù)洹顟B(tài)信息,進(jìn)行網(wǎng)絡(luò)全局管理;
- 基礎(chǔ)設(shè)施層包含了各種網(wǎng)絡(luò)設(shè)備,負(fù)責(zé)數(shù)據(jù)的處理、轉(zhuǎn)發(fā)和狀態(tài)收集。
SDN是對(duì)現(xiàn)有網(wǎng)絡(luò)架構(gòu)重新構(gòu)建的技術(shù)。傳統(tǒng)網(wǎng)絡(luò)架構(gòu)是由交換器、路由器等網(wǎng)絡(luò)基礎(chǔ)設(shè)施定義的網(wǎng)絡(luò)流量的傳輸,就像城市道路上的車(chē)流一樣,在沒(méi)有GPS導(dǎo)航前,每個(gè)十字路口如何轉(zhuǎn)向,基本是司機(jī)根據(jù)當(dāng)前看到的情況走自認(rèn)為最短最好的路徑,但高峰時(shí)段往往塞成一鍋粥。而SDN是從全城動(dòng)態(tài)交通狀況,根據(jù)每輛車(chē)的需求(如時(shí)間最短、費(fèi)用最省、不走高速等)來(lái)安排調(diào)度每輛車(chē)如何到達(dá)目的地,從全局視角調(diào)度,也保證了每輛車(chē)的最優(yōu)線路。
SDN技術(shù)因其架構(gòu)的開(kāi)放性和靈活部署及編程能力,成為下一代網(wǎng)絡(luò)核心技術(shù)的首選。無(wú)論是Google對(duì)于其DC(數(shù)據(jù)中心)系統(tǒng)完成的SDN改造,還是IT巨頭微軟和阿里巴巴分享的SDN云服務(wù)經(jīng)驗(yàn),無(wú)一例外都為此技術(shù)的應(yīng)用描繪了美好的前景。基于SDN的網(wǎng)絡(luò)虛擬化,能夠?qū)I(yè)務(wù)的邏輯網(wǎng)絡(luò)拓?fù)渑c物理網(wǎng)絡(luò)拓?fù)浣怦睿瑯O大提升業(yè)務(wù)交付速度,簡(jiǎn)化網(wǎng)絡(luò)運(yùn)維,同時(shí)能夠滿足運(yùn)營(yíng)商、政企對(duì)于降低網(wǎng)絡(luò)成本、提升業(yè)務(wù)創(chuàng)新速度的訴求。
SDN給運(yùn)維帶來(lái)的優(yōu)勢(shì)
傳統(tǒng)網(wǎng)絡(luò)由具有集成控制和數(shù)據(jù)轉(zhuǎn)發(fā)平面的設(shè)備組成,因此每個(gè)盒子都需要獨(dú)立配置和管理。即使對(duì)網(wǎng)絡(luò)進(jìn)行簡(jiǎn)單更改也可能需要數(shù)周甚至數(shù)月才能完成,因?yàn)楸仨殞?duì)每臺(tái)設(shè)備進(jìn)行更改。但隨著物聯(lián)網(wǎng)(IoT),云計(jì)算和移動(dòng)性的興起,SDN架構(gòu)中控制和數(shù)據(jù)平面的分離使控制能夠從設(shè)備中抽象出來(lái)并集中化,以便網(wǎng)絡(luò)管理員可以集中控制管理底層復(fù)雜基礎(chǔ)設(shè)施。從理論上講,所有網(wǎng)絡(luò)節(jié)點(diǎn)只需要轉(zhuǎn)發(fā)或數(shù)據(jù)平面來(lái)推送數(shù)據(jù)包。SDN給運(yùn)維帶來(lái)的優(yōu)勢(shì)具體如下:
- 減少開(kāi)銷(xiāo)
由于網(wǎng)絡(luò)管理員不再需要從一個(gè)設(shè)備到另一個(gè)設(shè)備來(lái)更改網(wǎng)絡(luò)配置,因此他們可以更有效地進(jìn)行必要的更改。不僅可以通過(guò)集中控制有效地控制網(wǎng)絡(luò)配置,還可以自動(dòng)化許多配置。
- 整體的集中式網(wǎng)絡(luò)管理
SDN方法的最大好處之一是可以通過(guò)單個(gè)設(shè)備控制所有網(wǎng)絡(luò)組件。物理和虛擬設(shè)備都可以通過(guò)單個(gè)API進(jìn)行控制,使得網(wǎng)絡(luò)管理員的生活更加輕松。
- 啟用“無(wú)網(wǎng)絡(luò)影響的網(wǎng)絡(luò)實(shí)驗(yàn)“
SDN為網(wǎng)絡(luò)帶來(lái)的靈活性允許管理員“跳過(guò)”SNMP所施加的限制并嘗試網(wǎng)絡(luò)配置,而網(wǎng)絡(luò)也不會(huì)受到影響。
- 更詳細(xì),粒度安全
虛擬化,云計(jì)算和移動(dòng)設(shè)備為信息安全帶來(lái)了重大挑戰(zhàn)。SDN控制器提供單點(diǎn)控制,其中信息安全策略和規(guī)則可以在整個(gè)組織中分發(fā)。此外,SDN控制器還提供了一個(gè)附加點(diǎn),可以放置安全策略來(lái)解決特定的軟件和應(yīng)用程序漏洞。
- 提高應(yīng)對(duì)網(wǎng)絡(luò)威脅的能力
SDN通過(guò)為IT人員提供網(wǎng)絡(luò)活動(dòng)的實(shí)時(shí)可見(jiàn)性,幫助他們應(yīng)對(duì)安全事件。您還可以對(duì)網(wǎng)絡(luò)進(jìn)行編程,以自動(dòng)響應(yīng)某些類(lèi)型的事件,從而減輕人為依賴(lài)。例如,假設(shè)有一臺(tái)筆記本電腦檢測(cè)到有人正在發(fā)送惡意軟件或攻擊另一個(gè)系統(tǒng)。SDN允許您對(duì)網(wǎng)絡(luò)進(jìn)行編程,以根據(jù)設(shè)備地址或應(yīng)用程序等屬性有選擇地阻止特定流量。
- 提高對(duì)網(wǎng)絡(luò)的可見(jiàn)度
整體提高組織網(wǎng)絡(luò)的可見(jiàn)性是軟件定義網(wǎng)絡(luò)的最大好處之一。首先,集中控制可以識(shí)別網(wǎng)絡(luò)安全性,性能和挑戰(zhàn)。所有這些都可以在不干擾網(wǎng)絡(luò)活動(dòng)的情況下進(jìn)行分析。通過(guò)找出帶寬或安全挑戰(zhàn)的源頭,可以在網(wǎng)絡(luò)中斷之前防止中斷和停機(jī)。
- 可擴(kuò)展性
此外,這種集中化的靈活性允許包含更多選項(xiàng),因?yàn)镾DN允許程序員編寫(xiě)公共接口并管理多個(gè)設(shè)備,而無(wú)需了解網(wǎng)絡(luò)上每個(gè)設(shè)備的復(fù)雜功能。
- 更有效地使用網(wǎng)絡(luò)資源
在傳統(tǒng)網(wǎng)絡(luò)中,確定數(shù)據(jù)如何傳播的網(wǎng)絡(luò)控制平面位于硬件中。在SDN基礎(chǔ)設(shè)施中,控制平面是獨(dú)立于網(wǎng)絡(luò)硬件操作的軟件功能。這種網(wǎng)絡(luò)和數(shù)據(jù)控制平面的邏輯分離使SDN能夠支持高級(jí)應(yīng)用和服務(wù),包括大數(shù)據(jù)分析,同時(shí)跟上不斷增長(zhǎng)的網(wǎng)絡(luò)服務(wù)需求。
- 提高正常運(yùn)行時(shí)間和可靠性
SDN程序內(nèi)置的靈活性和冗余可以消除在部署網(wǎng)絡(luò)期間可能發(fā)生的人為錯(cuò)誤。此外,SDN支持大多數(shù)物理和虛擬網(wǎng)絡(luò)設(shè)備的虛擬化,允許您在網(wǎng)絡(luò)的一個(gè)組件上執(zhí)行升級(jí)或替換,而無(wú)需使整個(gè)系統(tǒng)脫機(jī)。在發(fā)生停機(jī)時(shí),SDN支持對(duì)配置進(jìn)行快照,從而可以快速地從升級(jí)導(dǎo)致的中斷中恢復(fù)。
網(wǎng)絡(luò)的未來(lái)將越來(lái)越依賴(lài)于軟件,SDN在應(yīng)對(duì)傳統(tǒng)網(wǎng)絡(luò)方法所面臨的許多挑戰(zhàn)方面邁出了一大步。IT通過(guò)提高可見(jiàn)性和安全性,同時(shí)簡(jiǎn)化和自動(dòng)化操作,將網(wǎng)絡(luò)運(yùn)營(yíng)帶到現(xiàn)代領(lǐng)域。
SDN運(yùn)維工具的改變
在傳統(tǒng)網(wǎng)絡(luò)運(yùn)維中,運(yùn)維規(guī)章制度定了那么多,運(yùn)維人員能做到的其實(shí)也就那么多,針對(duì)不同廠商的硬件設(shè)備敲不同的命令行,出現(xiàn)問(wèn)題查查日志,寫(xiě)寫(xiě)故障報(bào)告。SDN網(wǎng)絡(luò)的主要特點(diǎn)是集群化、采虛擬的軟件網(wǎng)絡(luò)數(shù)據(jù)流,通過(guò)圖形化的方式簡(jiǎn)易呈現(xiàn),方便業(yè)務(wù)上線,以及后期內(nèi)容的維護(hù)。那么SDN這么牛,難道就不需要運(yùn)維工具了嗎,答案當(dāng)然是否定的!
在 SDN 系統(tǒng)里,有獨(dú)立的中央控制器和上層應(yīng)用層,轉(zhuǎn)發(fā)層只是作為最底層的數(shù)據(jù)轉(zhuǎn)發(fā),業(yè)務(wù)編排在控制器做,控制器是純軟件系統(tǒng),這套系統(tǒng)可以實(shí)現(xiàn)對(duì)外API對(duì)接,這時(shí)候 DevOps 就派上用場(chǎng)了。
DevOps促進(jìn)開(kāi)發(fā)人員,運(yùn)營(yíng)團(tuán)隊(duì)和基礎(chǔ)架構(gòu)專(zhuān)業(yè)人員之間的溝通和協(xié)作,以實(shí)現(xiàn)統(tǒng)一和自動(dòng)化的IT開(kāi)發(fā),實(shí)施和管理。同時(shí),SDN允許工程師將軟件控制應(yīng)用于網(wǎng)絡(luò)元素,集中管理和配置大量虛擬和物理基礎(chǔ)架構(gòu)。
1. SDN與NetDevops相遇
DevOps(Development和Operations的組合詞)是一組過(guò)程、方法與系統(tǒng)的統(tǒng)稱(chēng),用于促進(jìn)開(kāi)發(fā)(應(yīng)用程序/軟件工程)、技術(shù)運(yùn)營(yíng)和質(zhì)量保障(QA)部門(mén)之間的溝通、協(xié)作與整合。它是一種重視“軟件開(kāi)發(fā)人員(Dev)”和“IT運(yùn)維技術(shù)人員(Ops)”之間溝通合作的文化、運(yùn)動(dòng)或慣例。透過(guò)自動(dòng)化“軟件交付”和“架構(gòu)變更”的流程,來(lái)使得構(gòu)建、測(cè)試、發(fā)布軟件能夠更加地快捷、頻繁和可靠。它的出現(xiàn)使軟件行業(yè)日益清晰地認(rèn)識(shí)到:為了按時(shí)交付軟件產(chǎn)品和服務(wù),開(kāi)發(fā)和運(yùn)營(yíng)工作必須緊密合作。
2. DevOps和自動(dòng)化網(wǎng)絡(luò)需求
DevOps利用小型applet(或微服務(wù))中應(yīng)用程序的組件化,這些applet 可以分布在一系列數(shù)據(jù)中心資源(即公共云或私有云)中。容器(例如,Docker)正在成為快速引入新微服務(wù)流行方式。
微服務(wù)和DevOps應(yīng)用程序需要快速配置計(jì)算和存儲(chǔ)網(wǎng)絡(luò)資源,使其能夠快速運(yùn)行,根據(jù)需要進(jìn)行擴(kuò)展,以高可靠性執(zhí)行并保證服務(wù)的安全性。網(wǎng)絡(luò)需要管理工具來(lái)滿足開(kāi)發(fā)和自動(dòng)化的需求——減少停機(jī)時(shí)間和處理時(shí)的復(fù)雜性,同時(shí)又不需要發(fā)送Opex的數(shù)據(jù)。。
網(wǎng)絡(luò)負(fù)責(zé)為DevOps應(yīng)用程序快速配置適當(dāng)?shù)馁Y源,并在保護(hù)和管理這些快速遷移的應(yīng)用程序方面發(fā)揮關(guān)鍵作用。然而,微服務(wù)的敏捷性和快速變化的要求挑戰(zhàn)了傳統(tǒng)網(wǎng)絡(luò)的能力。應(yīng)用程序的分解意味著手動(dòng)網(wǎng)絡(luò)的移動(dòng)部件太多 - 因此網(wǎng)絡(luò)自動(dòng)化至關(guān)重要。使用DevOps預(yù)先測(cè)試網(wǎng)絡(luò)資源的能力對(duì)于減少應(yīng)用程序部署時(shí)間非常重要(例如,返回修復(fù)網(wǎng)絡(luò)問(wèn)題)。基本理想:開(kāi)發(fā)人員不必?fù)?dān)心網(wǎng)絡(luò)資源,包括IP地址或防火墻規(guī)則。
3. SDN,DevOps和自動(dòng)化相遇的地方
軟件定義的網(wǎng)絡(luò)優(yōu)化了開(kāi)發(fā)和自動(dòng)化的網(wǎng)絡(luò),使部署復(fù)雜應(yīng)用程序的IT組織能夠快速提供網(wǎng)絡(luò)資源和服務(wù)(包括安全策略)。SDN支持對(duì)網(wǎng)絡(luò)進(jìn)行集中管理,并將(手動(dòng))配置的挑戰(zhàn)從人員轉(zhuǎn)移到技術(shù)上,降低運(yùn)營(yíng)成本。
基于SDN的網(wǎng)絡(luò)可以自動(dòng)檢測(cè)流量變化,并根據(jù)應(yīng)用類(lèi)型,服務(wù)質(zhì)量和安全規(guī)則等參數(shù)選擇通過(guò)網(wǎng)絡(luò)獲取的路徑數(shù)據(jù)。軟件控制平面管理和隱藏網(wǎng)絡(luò)復(fù)雜性,能夠使10,000個(gè)交換機(jī)看起來(lái)像一個(gè)。SDN可以指示網(wǎng)絡(luò)提供與其相關(guān)應(yīng)用程序一致的服務(wù),并支持快速部署大量新應(yīng)用程序和微服務(wù)(例如,容器)。
SDN提供自動(dòng)化網(wǎng)絡(luò)流程的能力,以快速為DevOps應(yīng)用程序提供網(wǎng)絡(luò)/安全資源。它可以通過(guò)將(手動(dòng))配置的挑戰(zhàn)從人員轉(zhuǎn)移到技術(shù)來(lái)降低運(yùn)營(yíng)成本。許多超大規(guī)模的云提供商 - 包括谷歌,蘋(píng)果,F(xiàn)acebook和微軟 - 已經(jīng)部署了SDN技術(shù),以幫助自動(dòng)化其網(wǎng)絡(luò)的配置和管理。IT領(lǐng)導(dǎo)者應(yīng)考慮部署SDN以滿足其DevOps團(tuán)隊(duì)和相關(guān)應(yīng)用程序不斷變化的需求。
再談SDN 運(yùn)維工作,SDN有那么多優(yōu)點(diǎn),那么運(yùn)維工作會(huì)不會(huì)很輕松呢?SDN運(yùn)維工作主要包含兩個(gè)方面,一個(gè)是日常運(yùn)維、二是工程項(xiàng)目。日常運(yùn)維工作和傳統(tǒng)的網(wǎng)絡(luò)運(yùn)維類(lèi)似,值班監(jiān)控,一二線故障解決,以及和各部門(mén)溝通。
重點(diǎn)是跨部門(mén)溝通,傳統(tǒng)的網(wǎng)絡(luò)運(yùn)維因?yàn)楹芏嘣O(shè)備和功能都是相互捆綁的,相關(guān)的功能函數(shù)并不對(duì)外開(kāi)放,只有設(shè)備供應(yīng)商自己清楚,所以運(yùn)維常常是一個(gè)封閉的部門(mén),和開(kāi)發(fā)并不會(huì)有太多的交集。但是進(jìn)入SDN的時(shí)代以后,運(yùn)維會(huì)涉及到很多部門(mén),例如測(cè)試、研發(fā)等。這時(shí)運(yùn)維已不再是封閉的,需要從一個(gè)新的角度去看待這個(gè)崗位,需要提前與開(kāi)發(fā)部門(mén)、測(cè)試部門(mén)的網(wǎng)絡(luò)工程師做互動(dòng),這一點(diǎn)和DevOps的要求也是很符合的,即為了按時(shí)交付軟件產(chǎn)品和服務(wù),開(kāi)發(fā)和運(yùn)營(yíng)工作必須緊密合作。
SDN運(yùn)維用到的工具和傳統(tǒng)網(wǎng)絡(luò)運(yùn)維類(lèi)似,主要有 Cacti、Smokeping、Nagios、Zabbix。但是現(xiàn)在更加講究開(kāi)源,開(kāi)源更能促進(jìn)SDN和網(wǎng)絡(luò)技術(shù)的發(fā)展,運(yùn)維工程師可以從中學(xué)到更多關(guān)于網(wǎng)絡(luò)的知識(shí),對(duì)于網(wǎng)絡(luò)會(huì)擁有更多的自主管理權(quán),工程師還可以在開(kāi)源的軟件上根據(jù)自己需求做二次開(kāi)發(fā),較傳統(tǒng)的封閉式運(yùn)維大大減少網(wǎng)絡(luò)運(yùn)維成本和提高運(yùn)維效率。
SDN自動(dòng)化運(yùn)維
運(yùn)維包括告警監(jiān)控、變更、排障三個(gè)階段。在介紹告警之前談一下運(yùn)維人員需要關(guān)心的SLO和SLI,其次會(huì)簡(jiǎn)要分析監(jiān)控,分析,變更和排障。
1. 運(yùn)維服務(wù)質(zhì)量設(shè)計(jì)
在傳統(tǒng)的網(wǎng)絡(luò)運(yùn)維中,網(wǎng)絡(luò)工程師們都關(guān)注SLA,但作為運(yùn)維的人都會(huì)關(guān)注SLO和SLI。我們需要找到服務(wù)質(zhì)量的指標(biāo)是什么,根據(jù)指標(biāo)制定目標(biāo)。SLI是經(jīng)過(guò)仔細(xì)定義的測(cè)量指標(biāo),它根據(jù)不同系統(tǒng)特點(diǎn)確定要測(cè)量什么,SLI的確定是一個(gè)非常復(fù)雜的過(guò)程。SLI要回答要測(cè)量的指標(biāo)是什么,測(cè)量時(shí)系統(tǒng)狀態(tài)怎么樣,如何匯總處理測(cè)量的指標(biāo),測(cè)量指標(biāo)能否描述服務(wù)質(zhì)量,測(cè)量指標(biāo)的可信度。主要關(guān)注性能、可用性、質(zhì)量、內(nèi)部指標(biāo)和因素人這幾個(gè)方面。SLO(服務(wù)等級(jí)目標(biāo))指定了服務(wù)所提供功能的一種期望狀態(tài)。SLO里面應(yīng)該包含所有能夠描述服務(wù)應(yīng)該提供什么樣功能的信息。服務(wù)提供者用它來(lái)指定系統(tǒng)的預(yù)期狀態(tài);開(kāi)發(fā)人員編寫(xiě)代碼來(lái)實(shí)現(xiàn);客戶依賴(lài)于SLO進(jìn)行商業(yè)判斷。SLO里沒(méi)有提到,如果目標(biāo)達(dá)不到會(huì)怎么樣。網(wǎng)絡(luò)時(shí)延、丟包率以及端到端都可以作為衡量的指標(biāo),我們根據(jù)這個(gè)指標(biāo)制定SLO。
SLA是一個(gè)涉及雙方的合約,雙方必須都要同意并遵守這個(gè)合約。當(dāng)需要對(duì)外提供服務(wù)時(shí),SLA是非常重要的一個(gè)服務(wù)質(zhì)量信號(hào),需要產(chǎn)品和法務(wù)部門(mén)的同時(shí)介入。
2. 監(jiān)控告警
SDN能更多的進(jìn)行白盒監(jiān)控,即通過(guò)對(duì)系統(tǒng)內(nèi)部的性能指標(biāo)進(jìn)行監(jiān)控了解系統(tǒng)的運(yùn)行狀態(tài)。從南向接口看,SDN只需要監(jiān)控少數(shù)幾種協(xié)議,監(jiān)控相對(duì)簡(jiǎn)單,而面對(duì)業(yè)務(wù)變更時(shí)更是可以隨著API變更而變更。主要復(fù)雜度集中在控制平面和業(yè)務(wù)編排,監(jiān)控業(yè)主要集中在控制平面健壯性,用戶業(yè)務(wù)狀況以及控制轉(zhuǎn)發(fā)的一致性等方面。在大型網(wǎng)絡(luò)里因底層鏈路故障導(dǎo)致的大量路徑計(jì)算和重新優(yōu)化需要控制及時(shí),反應(yīng)要快。面向最終用戶的web接口又會(huì)需要對(duì)各種請(qǐng)求和配置變更做出實(shí)時(shí)響應(yīng)和分析。
運(yùn)維系統(tǒng)中監(jiān)控告警設(shè)計(jì),通常從最底層的采集開(kāi)始,自上而下設(shè)計(jì),其次是存儲(chǔ)、功能模塊開(kāi)發(fā)、上層告警通道、用戶側(cè)。從采集的方式上來(lái)說(shuō)要根據(jù)網(wǎng)絡(luò)架構(gòu)來(lái)選擇是采用集中式的,還是分散式的。如果網(wǎng)絡(luò)中的轉(zhuǎn)發(fā)節(jié)點(diǎn)較多,那么在這種情況下就無(wú)法采用集中式。需要根據(jù)自己的業(yè)務(wù)分布點(diǎn),制定不同區(qū)域性的分布采集,包括存儲(chǔ)。部署中央存儲(chǔ)和分布式存儲(chǔ),分布采集后實(shí)時(shí)同步到中央存儲(chǔ),同時(shí)需要在本地存儲(chǔ)后做備份。
功能模塊方面通過(guò)在底層采集原始數(shù)據(jù),根據(jù)原有系統(tǒng)的規(guī)則,從監(jiān)控告警到告警通道,做一個(gè)中間層,這網(wǎng)絡(luò)管理人員可以根據(jù)自己網(wǎng)絡(luò)情況做的自定義的規(guī)則。
拿到原始數(shù)據(jù)后,如何將數(shù)據(jù)更好的展現(xiàn)出來(lái),將有用的信息實(shí)時(shí)同步。SDN中實(shí)時(shí)告警不像傳統(tǒng)網(wǎng)絡(luò)只在底層轉(zhuǎn)發(fā),現(xiàn)在它可以對(duì)業(yè)務(wù)系統(tǒng)和網(wǎng)元進(jìn)行實(shí)時(shí)監(jiān)控(操作系統(tǒng)的穩(wěn)定性)。有了告警信息以后,對(duì)它進(jìn)行分類(lèi),然后才能做接下來(lái)的告警分析。
3. 日志統(tǒng)計(jì)分析
日志統(tǒng)計(jì)分析,現(xiàn)在大多是公司都使用ELK來(lái)分析。該軟件可以根據(jù)自己的業(yè)務(wù)做不同的開(kāi)發(fā)。
日志包括整個(gè)SDN系統(tǒng)。從上層的控制系統(tǒng),中層操作系統(tǒng)、存儲(chǔ)、業(yè)務(wù)編排,底層轉(zhuǎn)發(fā)網(wǎng)元,最后底層傳輸。這些在傳統(tǒng)的網(wǎng)絡(luò)中,運(yùn)維人員是不會(huì)關(guān)心的,只會(huì)關(guān)心網(wǎng)絡(luò)設(shè)備。
4. 流量統(tǒng)計(jì)分析
流量統(tǒng)計(jì)分析,現(xiàn)在網(wǎng)管系統(tǒng)和運(yùn)維人員關(guān)注設(shè)備流量、端口流量,SDN 需要關(guān)注整條鏈路端口,更重要的是業(yè)務(wù)流量,SDN 最大的特點(diǎn)是能夠跟業(yè)務(wù)系統(tǒng)做到關(guān)聯(lián),能夠通過(guò)運(yùn)維系統(tǒng)查看所有業(yè)務(wù)相關(guān)的流量信息。
5. 變更
在傳統(tǒng)的網(wǎng)絡(luò)中,由于時(shí)間還有業(yè)務(wù)對(duì)網(wǎng)絡(luò)不同的需求后,很難有統(tǒng)一的配置模板。各種臨時(shí)的配置在不同的設(shè)備上安家。現(xiàn)在的網(wǎng)絡(luò)維護(hù)人員不敢刪除上一個(gè)運(yùn)維人員的設(shè)定。天長(zhǎng)日久,人,設(shè)備、需求的變換會(huì)導(dǎo)致配置和實(shí)際狀況脫節(jié)。SDN則基本擺脫了設(shè)備配置問(wèn)題。基礎(chǔ)架構(gòu)數(shù)據(jù)通過(guò)自發(fā)現(xiàn)和初始定義可以在GUI上實(shí)現(xiàn)。業(yè)務(wù)數(shù)據(jù)通過(guò)GUI和API實(shí)現(xiàn),軟件升級(jí)時(shí),控制平面的前端、后端、業(yè)務(wù)編排、底層控制器各組件既可以分開(kāi)升級(jí)也可以統(tǒng)一升級(jí),對(duì)轉(zhuǎn)發(fā)也沒(méi)有明顯的影響。
6. 自動(dòng)化排障
SDN排障更多的是與Devops結(jié)合,通過(guò)軟件化手段解決。一個(gè)好的故障處理系統(tǒng)能夠自愈和關(guān)聯(lián)分析。當(dāng)出現(xiàn)多個(gè)警告時(shí),如何讓這些警告自動(dòng)關(guān)聯(lián),然后生成一個(gè)真正一個(gè)有用的。故障自愈就是在關(guān)聯(lián)以后,故障不需要人為的干預(yù)就可以自愈。
未來(lái)傳統(tǒng)的運(yùn)維人員將何去何從
基于SDN技術(shù)的未來(lái)電信網(wǎng)絡(luò)架構(gòu)的演進(jìn)對(duì)運(yùn)維流程產(chǎn)生了深刻的影響,電信技術(shù)與IT技術(shù)的融合對(duì)參與系統(tǒng)的運(yùn)維團(tuán)隊(duì)也提出了技能方面的新要求。
對(duì)于SDN的運(yùn)維人員除了要知道傳統(tǒng)的運(yùn)維技能和運(yùn)維工具以外,還要了解SDN運(yùn)維體系目前從SDN系統(tǒng)來(lái)講從最底層的資源,網(wǎng)絡(luò)設(shè)備、轉(zhuǎn)發(fā)網(wǎng)元、設(shè)備、服務(wù)器。采集部分主要涵蓋 SNMP 的采集,對(duì)傳統(tǒng)設(shè)備N(xiāo)etconf命令下發(fā),對(duì)新設(shè)備 Openflow 的協(xié)議,對(duì)CLI的管理。
SDN運(yùn)維體系架構(gòu)
中間的存儲(chǔ)是獨(dú)立分開(kāi)的,中間有日志、配置庫(kù)、知識(shí)庫(kù),在存儲(chǔ)部分獨(dú)立分開(kāi)。功能方面包括監(jiān)控告警和數(shù)據(jù)采集,數(shù)據(jù)分析和統(tǒng)計(jì),流程管理和項(xiàng)目管理,有很大一部分是資源管理,資源管理包括文檔配置,這部分主要基于CMDB,功能非常強(qiáng)大,如何結(jié)合SDN系統(tǒng)用起來(lái),要根據(jù)自己網(wǎng)絡(luò)底層和控制器開(kāi)發(fā)做制定。
SDN現(xiàn)在越被大多數(shù)公司采用,那對(duì)于企業(yè)來(lái)說(shuō)如何培養(yǎng)出一個(gè)合適的SDN運(yùn)維小能手呢?一般公司會(huì)選擇培訓(xùn)現(xiàn)有的員工,因?yàn)樗麄冇X(jué)得培訓(xùn)現(xiàn)有員工比尋找和招聘新員工更具經(jīng)濟(jì)效益。投資現(xiàn)有員工需要積極主動(dòng)的自上而下戰(zhàn)略,提供大量培訓(xùn)機(jī)會(huì)。其次從個(gè)人的角度來(lái)說(shuō)網(wǎng)絡(luò)專(zhuān)業(yè)人士應(yīng)該把握好自己的未來(lái)和職業(yè)生涯。并不是每個(gè)網(wǎng)工都需要成為程序員。相反,SDN需要更廣泛的網(wǎng)絡(luò)概念和基礎(chǔ)知識(shí)。要理解軟件系統(tǒng)是如何工作的,但并不意味著你必須編寫(xiě)代碼,可需要了解整個(gè)生態(tài)系統(tǒng)是如何運(yùn)作的,以及事情是在哪里完成的。除了這些基礎(chǔ)知識(shí),網(wǎng)絡(luò)專(zhuān)業(yè)人員還應(yīng)利用任何學(xué)習(xí)的機(jī)會(huì),建議網(wǎng)絡(luò)專(zhuān)業(yè)人士在制定計(jì)劃后需要堅(jiān)持下去。仔細(xì)規(guī)劃并專(zhuān)注于自己的軌跡,不要被外界情況所影響。






















