細(xì)數(shù)各種關(guān)鍵績效指標(biāo)KPI
IT服務(wù)從傳統(tǒng)的注重硬件運(yùn)行和軟件監(jiān)控轉(zhuǎn)向使用關(guān)鍵績效指標(biāo)(KPI)為業(yè)務(wù)的重點(diǎn)。IT行業(yè)的KPI是一個抽象的目標(biāo),如用戶體驗(yàn)或工作效率。
IT服務(wù)的KPI指標(biāo)與常見的監(jiān)測指標(biāo)之間的差異是企業(yè)領(lǐng)導(dǎo)的參與。任何一個企業(yè)都可以部署一些監(jiān)控工具來跟蹤分配給虛擬機(jī)的資源或服務(wù)器的帶寬利用率等。這些分散的技術(shù)因素對IT技術(shù)人員有幫助,但對企業(yè)的實(shí)際應(yīng)用價值并不大。企業(yè)應(yīng)該了解KPI,利用KPI來管理和解決問題。
KPI可以幫助企業(yè)高管表現(xiàn)出管理投資的正確和成功。例如,一些依靠線上銷售或者網(wǎng)絡(luò)交易的web系統(tǒng)的KPI指標(biāo)就包括應(yīng)用程序的性能和系統(tǒng)利用效率。還有附加指標(biāo)測量的IT基礎(chǔ)設(shè)施,包括交易的狀態(tài),效率和靈活性。
雖然ITIL有一套通用的性能建議設(shè)置,但它沒有一套可以通用于所有項(xiàng)目的需求關(guān)鍵績效指標(biāo)。IT的關(guān)鍵績效指標(biāo)通常分為三大類:服務(wù)交付力、服務(wù)或性能的效率和靈活性(應(yīng)對服務(wù)的變化)。企業(yè)的IT服務(wù)提供商也應(yīng)該使用服務(wù)可用性的KPI指標(biāo)。
服務(wù)交付力
• 服務(wù)吞吐量
服務(wù)吞吐量體現(xiàn)在用戶對應(yīng)用程序或系統(tǒng)的使用或需求。通常是指事務(wù)的數(shù)量或計算工作的措施。
•響應(yīng)時間
響應(yīng)時間的KPI指標(biāo)包括需要完成事務(wù)的時間長短。響應(yīng)時間包括多種基礎(chǔ)設(shè)施元素,如服務(wù)器、網(wǎng)絡(luò)和存儲。它與服務(wù)級別協(xié)議有緊密的關(guān)系(SLA)。
• 資源利用率
舉個例子,物理或虛擬機(jī)的資源與被分配資源總量的比值就是一種利用率。如果一個虛擬機(jī)分配了10G的內(nèi)存,而它使用了10G的內(nèi)存,利用率便是100%。
•正常運(yùn)行時間
正常運(yùn)行時間是衡量應(yīng)用或系統(tǒng)正常運(yùn)行時間的百分比指標(biāo)。群集技術(shù),自動恢復(fù)服務(wù)器和網(wǎng)絡(luò)故障轉(zhuǎn)移都有助于正常運(yùn)行時間的指標(biāo)。
企業(yè)可以利用這些指標(biāo)來計算其定制服務(wù)KPI。例如,如果設(shè)備的吞吐量和正常運(yùn)行時間的指標(biāo)高而響應(yīng)時間的指標(biāo)低,無論資源利用率的高低,服務(wù)分?jǐn)?shù)都不會受到很大影響。但如果資源利用率和響應(yīng)時間增加而吞吐量或者運(yùn)行時間下降,則會嚴(yán)重影響服務(wù)分?jǐn)?shù)。
服務(wù)效率和性能
•工作效率還是性能?
這個派生的指標(biāo)將工作量的分配資源和利用資源拿來做比較。這個指標(biāo)可以看出工作量對資源需求的大小,是浪費(fèi)資源、資源不足還是剛剛好。
•系統(tǒng)效率和性能
系統(tǒng)效率是以服務(wù)器的分配資源與可用資源對比的一個指標(biāo),讓服務(wù)器能達(dá)到***的性能負(fù)載。從這個指標(biāo)可以看出服務(wù)器是存在資源浪費(fèi)還是資源超載。
工作負(fù)載和系統(tǒng)的指標(biāo)通常是通過數(shù)據(jù)中心匯總數(shù)據(jù)后計算出來的平均值。IT團(tuán)隊(duì)通過快速測量工作期間的狀態(tài),再比較它以前的狀態(tài)來為新技術(shù)項(xiàng)目的投資提供必要的數(shù)據(jù)。例如得到一個較低的KPI數(shù)據(jù),就表明可能需要升級負(fù)載均衡或其他技術(shù)項(xiàng)目。
系統(tǒng)敏捷性
•服務(wù)請求回應(yīng)
服務(wù)請求回應(yīng)是指在可接受的時間內(nèi)回應(yīng)通過呼叫或者其他方式的服務(wù)請求,并成功解決的事件數(shù)量。
•服務(wù)處理時間TTR
TTR是衡量需要解決服務(wù)請求的時間。例如當(dāng)收到一個新虛擬機(jī)的請求時,評估的時間,方案的確定,批準(zhǔn)到提供一個新的虛擬機(jī)這一整套流程的時間;或者收到要進(jìn)行資源分配更改的請求,所需要的性能檢測時間。
伴隨著IT服務(wù)請求的數(shù)量增加,TTR會相應(yīng)的下降??梢钥闯鯰TR是靈活的,能夠應(yīng)對變化的工作量和用戶需求。如果服務(wù)請求和TTR的數(shù)量同時增加,則表明IT服務(wù)存在明顯的服務(wù)敏捷性短板。
服務(wù)可用性
IT服務(wù)提供商或其他提供受SLA(Service-Level Agreement 服務(wù)等級協(xié)議)約束的IT服務(wù)組織,都可以采用SLA KPI,這是一個涉及范圍廣泛的指標(biāo)。
•服務(wù)請求處理率
這個KPI指標(biāo)是度量在一個可接受的時間對服務(wù)請求提供可用服務(wù)或者幫助的百分比。
•正常運(yùn)行時間
正常運(yùn)行時間指標(biāo)體現(xiàn)在一個計費(fèi)周期內(nèi)服務(wù)的可用性上。在周期內(nèi),也許不可避免有一定量的服務(wù)中斷,但這個中斷時間可以衡量SLA的履約能力和經(jīng)營業(yè)績。
•平均故障間隔時間(MTBF)/平均修復(fù)時間(MTTR)
MTBF和MTTR是指故障頻率和修復(fù)故障所需要時間的兩個指標(biāo)。
•服務(wù)請求數(shù)量
這個指標(biāo)是投訴或服務(wù)請求的數(shù)量。它的增加表明某些系統(tǒng)或平臺存在問題。
收集所有的數(shù)據(jù),整合并制定結(jié)果提供給業(yè)務(wù)主管,它是SLA問題的一個重要早期預(yù)警。根據(jù)這個指標(biāo)提供的基礎(chǔ)數(shù)據(jù)可以為業(yè)務(wù)目標(biāo)改善服務(wù)。
KPI指標(biāo)的疏漏
1.主觀指標(biāo),如用戶滿意度等。KPI主要是基于客觀特征的應(yīng)用程序的性能和吞吐量等指標(biāo),但KPI總是使用客觀的可測量的參數(shù),這會導(dǎo)致主觀指標(biāo)的缺失。
2.業(yè)務(wù)和IT團(tuán)隊(duì)的領(lǐng)導(dǎo)對KPI的看法永遠(yuǎn)一致的時候。例如,一個企業(yè)可能會跟蹤統(tǒng)計系統(tǒng)利用率和運(yùn)行時間。在早期,利用率更為重要,但由于服務(wù)的發(fā)展和利用率開始達(dá)到預(yù)期目標(biāo),正常運(yùn)行時間則變得有更大的意義。
3.企業(yè)領(lǐng)導(dǎo)人沒有根據(jù)商業(yè)模式的變化更新KPI。例如,一個新建數(shù)據(jù)中心建設(shè)的重點(diǎn)在于能源消耗和成本控制。一旦達(dá)到了這些目標(biāo),重點(diǎn)應(yīng)該轉(zhuǎn)變?yōu)樘岣叻?wù)質(zhì)量或靈活性。
選擇關(guān)鍵績效指標(biāo)衡量IT服務(wù)
一個也許最重要但被忽視的方面——KPI是與業(yè)務(wù)緊密相關(guān)的。無論會計、市場營銷、銷售等等行業(yè),IT服務(wù)都可以管理和提供符合行業(yè)所需的應(yīng)用系統(tǒng)和工具的統(tǒng)計報告。但并不是每一個指標(biāo)都必不可少或可以作為測量目標(biāo)。從公司到公司,甚至從項(xiàng)目到項(xiàng)目,這些KPI指標(biāo)的作用并不相同。
選擇IT的KPI指標(biāo)首先要了解這些指標(biāo)的作用。專注于服務(wù)的業(yè)務(wù)將關(guān)注在不同負(fù)載條件下的事務(wù)或吞吐量相關(guān)的測量和活動指標(biāo)。相反,企業(yè)關(guān)注控制成本的指標(biāo),包括計算資源的可用性指標(biāo)、利用率和系統(tǒng)功耗。
因此,隨著時間推移,根據(jù)不同區(qū)域選擇可測量并建立閾值的機(jī)制,實(shí)現(xiàn)與監(jiān)控管理工具測量和選擇不同KPI指標(biāo)是一個成熟IT服務(wù)的關(guān)鍵。































