企業(yè)在2022年應(yīng)避免這六大云成本優(yōu)化問題
在企業(yè)發(fā)展過程中,全球大量工程團隊會將時間和精力投入到云優(yōu)化上,但研究表明大多數(shù)企業(yè)無法跟上飆升的云成本。

發(fā)生這種情況的原因有很多,如果企業(yè)不制定解決方案,這種情況還會繼續(xù)發(fā)生。原因包括低成本的可見性、棘手的云定價以及確定未來需求的問題。由于這些迫在眉睫的問題,企業(yè)會浪費云資源、時間和金錢。
在本文中,我們將介紹:
- 為什么云成本優(yōu)化勢在必行?
- 2022年要解決的6個頂級云成本優(yōu)化問題
1、為什么云成本優(yōu)化如此具有挑戰(zhàn)性?
公共云的按使用付費模式給工程團隊帶來了自由,但事實證明這種自由是比較昂貴的。
研究表明,大多數(shù)企業(yè)難以應(yīng)對不斷上漲的云成本。傳統(tǒng)的公共云支出平均超出預(yù)算 24%。這種情況仍然發(fā)生的原因有很多。
這些通常歸結(jié)為低成本可見性、復(fù)雜的云定價以及預(yù)測未來需求的問題。所有這些問題都可能會影響企業(yè)的業(yè)務(wù)支出的金額。
云提供商已經(jīng)了解到這一點,他們也無法提供幫助。對于大多數(shù)企業(yè)來說,解碼云賬單可能會讓人不知所措。這可能會讓一些工程團隊望而卻步,但選擇忽略云賬單并不能真正解決問題。
2、2022年要解決的6大云成本優(yōu)化問題
1)被預(yù)訂和儲蓄計劃所吸引
考慮降低云成本的第一個解決方案是為企業(yè)團隊當(dāng)前使用的服務(wù)支付更少的費用。與按需定價模式相比,企業(yè)會選擇儲蓄計劃或預(yù)訂,因為它們具有較大的折扣。
預(yù)先支付可預(yù)測的云賬單確實令人感到高興。
但是,企業(yè)團隊會發(fā)現(xiàn)并沒有解決問題,企業(yè)只是得到了折扣而已,這里有什么問題?
下面一起了解 Pinterest 降低云成本的故事,Pinterest 已提前為 AWS 服務(wù)支付了 1.7 億美元,但仍需額外支付 2000 萬美元購買額外資源。這超過了 10%。Pinterest 可能不介意這種規(guī)模的額外成本,但創(chuàng)業(yè)公司可能會被這些額外的成本所摧毀。
關(guān)鍵是,Pinterest 的故事讓我們明白,預(yù)測企業(yè)在 1 到 3 年內(nèi)需要多少容量是很困難的。
長期致力于單一提供商,沒有靈活性,企業(yè)的業(yè)務(wù)會被鎖定,并且企業(yè)可能需要為不斷變化的業(yè)務(wù)需求付出高昂的代價。
如何應(yīng)對儲蓄計劃?
最好的解決方案是盡可能避免儲蓄計劃。盡量不要提前購買資源,同時考慮解決云支出的不同選擇,包括:
- 自動定量
- 調(diào)整大小
- 資源調(diào)度
- 裝箱
2)屈服于過度配置的陷阱
當(dāng)企業(yè)選擇的資源大于運行工作負載所需的資源時,就會發(fā)生過度配置。這可以使團隊獲得一種安全心態(tài),因為沒有團隊希望在關(guān)鍵項目的中途出現(xiàn)中斷。
在某些企業(yè)中,團隊習(xí)慣于擁有比“備份”所需的更多資源。盡管在性能方面這個選項對工程師來說是完美的,但它會增加云浪費,從而對企業(yè)的運營成本造成損害。
過度配置有什么問題?
最簡單的答案是,過度配置會導(dǎo)致云資源浪費和不必要的開支,這些開支很快就會達到頂點。
在企業(yè)的團隊中鼓勵過度配置在未來會導(dǎo)致糟糕的結(jié)果。如果團隊習(xí)慣于獲得比工作負載要求更大的實例,則需考慮在擴展業(yè)務(wù)時這是如何工作的。云成本將占企業(yè)業(yè)務(wù)收入的很大一部分。
把這筆錢花在一些對企業(yè)有長期幫助的實質(zhì)性的事情上會更好。例如,關(guān)于品牌和營銷,以便企業(yè)可以將其業(yè)務(wù)建立一個可靠的業(yè)務(wù)來源。
如何處理過度配置?
典型的方法是花錢購買定制監(jiān)控和成本管理解決方案。通過調(diào)整建議大小,企業(yè)可以幫助減少團隊對過度配置資源的依賴。但是,企業(yè)仍然需要手動實現(xiàn)它們。
另一種解決方案是自動化。自動調(diào)整大小可以選擇最可能滿足企業(yè)的應(yīng)用程序要求的實例類型和大小,同時控制成本。
當(dāng)集群需要額外的節(jié)點時,人工智能驅(qū)動的實例選擇算法會自動選擇驅(qū)動最終性能的資源。企業(yè)團隊無需花費時間和精力進行分類,因為它是自動化的。
由于過度配置嵌套在業(yè)務(wù)文化中,因此創(chuàng)建成本優(yōu)化例程以提高性能、可靠性和降低成本至關(guān)重要。自動化可能是企業(yè)變革的第一個重要步驟。
3)受到未使用的云資源的影響
企業(yè)團隊很容易遺忘為項目創(chuàng)建的實例。
大多數(shù)團隊都在努力處理沒有工作但仍在繼續(xù)增加成本的未使用資源。Adobe就曾犯過此類錯誤,他們每天在 Azure 的計劃外費用高達8萬美元。這些是企業(yè)無法承受的錯誤類型。
這個問題特別適用于同時發(fā)生各種事件、缺乏資源可見性的大型企業(yè)。
在 IT 團隊的領(lǐng)域之外的額外成本可能占企業(yè)所有 IT 開支的40%。此外,統(tǒng)計數(shù)據(jù)顯示,影子云的使用量可以達到已知云使用量的10倍。
未使用的云資源有什么問題?
未使用和未管理的云資源會增加成本,導(dǎo)致復(fù)雜的可持續(xù)性結(jié)果。
數(shù)據(jù)中心使用大量電力和硬件,主要影響企業(yè)的碳足跡。因此,減少云浪費對于減少不必要的支出和相關(guān)的碳足跡非常重要。
4)處理需求下降和高峰的效率低下
大多數(shù)其他應(yīng)用程序會隨著時間的推移在使用方面發(fā)生這些變化,但對于大多數(shù)公司來說,在性能和成本之間保持平衡仍然是一項艱巨的任務(wù)。
問題是什么?
如果企業(yè)團隊不留意,若對資源有嚴格的限制,不斷增長的流量可能會產(chǎn)生巨額的云費用,或者導(dǎo)致企業(yè)的應(yīng)用程序崩潰。因此,當(dāng)需求低時,總是存在多付費的風(fēng)險。另一方面,當(dāng)需求高時,服務(wù)質(zhì)量可能會受到影響。
云成本管理解決方案可以監(jiān)控企業(yè)的使用情況,并在超出允許限制時實時發(fā)送通知。這些工具可以就如何根據(jù)不斷變化的需求調(diào)整云資源提供建議。但是,手動云管理既繁瑣又耗時。
這些是企業(yè)需要了解的事情:
- 小心處理流量激增和下降——分別在所有服務(wù)中向上/向下擴展資源。
- 確保應(yīng)用于一個工作負載的更改不會影響其他工作負載。
- 手動優(yōu)化和管理資源組,以了解有適合企業(yè)工作負載的資源。
解決方案是什么?
這是另一個可以使用云自動化來幫助企業(yè)節(jié)省時間和資源的領(lǐng)域。
通過自動擴展,企業(yè)可以管理上述所有任務(wù)并控制云成本。如果利用容器編排器 Kubernetes,則可以獲得三個優(yōu)勢:
- Horizontal Pod Autoscaler (HPA)添加或刪除 pod 重復(fù)項以匹配不斷變化的使用情況。它研究企業(yè)的應(yīng)用程序以確定副本的數(shù)量是否應(yīng)該更改。
- Vertical Pod Autoscaler (VPA)減少/增加 CPU 和內(nèi)存使用請求,以幫助企業(yè)根據(jù)當(dāng)前使用情況調(diào)整資源。
- Cluster Autoscaler在支持的平臺上更改集群中的節(jié)點數(shù)量。
5)拒絕使用 Spot 實例
如果將其與按需定價進行比較,云服務(wù)提供商會以大幅折扣提供其未使用的容量。在 AWS 中,Spot實例的價格是正常價格的10%。
Spot實例有什么挑戰(zhàn)?
當(dāng)企業(yè)競標(biāo)備用計算資源時,無法知道這些容量可用多長時間。Spot實例具有默認持續(xù)時間;例如,AWS提供了一個Spot實例,可以提供超過5小時的不間斷時間保證。
除此之外,服務(wù)提供商可以收回Spot實例并為企業(yè)提供僅2.5分鐘的簡短通知。
在那段時間內(nèi)進行更改是不可行的。開發(fā)新虛擬機也需要更多時間,因此存在潛在停機風(fēng)險。
因此,如果企業(yè)在計劃使用Spot實例之前,要了解到會發(fā)生中斷的情況。它們不是關(guān)鍵工作負載的理想選擇。
如何管理這個問題?
盡管存在上述問題,但對于可以擁有多個副本的服務(wù)來說,Spot實例是非常神奇的。大多數(shù)服務(wù)在當(dāng)代架構(gòu)中都是無狀態(tài)的,這很好,因為Kubernetes 就是為這種設(shè)置而構(gòu)建的。
以下是使用Spot實例的整個過程:
- 確定企業(yè)的工作負載及其管理中斷的能力非常重要。
- 尋找供應(yīng)商提供的實例。嘗試選擇不太受歡迎的實例并監(jiān)控它們的中斷頻率。
- 設(shè)置一個最高出價以避免價格立即飆升時中斷。
- 最好按組管理Spot實例并請求多個實例以增加填充它們的機會。
企業(yè)可以手動執(zhí)行這些步驟,但要使其正常工作,請為大型配置、設(shè)置和維護任務(wù)做好準(zhǔn)備。
6)推遲云自動化
在這些情況下,自動化會有所幫助。除了上面提到的過程之外,自動化解決方案可以在Spot實例不可用時立即提供幫助。
如果企業(yè)處理過云原生技術(shù),那么自動化可能是其業(yè)務(wù)的最佳選擇。云自動化為大型企業(yè)的 IT 團隊提供了驚人的優(yōu)勢。
首先,它減少了配置虛擬機、創(chuàng)建集群或選擇合適資源的人工勞動。此更改可幫助企業(yè)節(jié)省時間,并允許企業(yè)的團隊處理重要任務(wù)并充分利用其云基礎(chǔ)架構(gòu)。
此外,自動化工具提供對部署至關(guān)重要的頻繁更新。它還顯著降低了人為錯誤的幾率,降低了基礎(chǔ)設(shè)施成本,并改進了備份流程。
最后,自動化使企業(yè)能夠了解整個業(yè)務(wù)中難以管理的正在使用的資源。簡而言之,云自動化是科技行業(yè)的新常態(tài)。
為什么不應(yīng)該延遲云自動化?
如果云自動化提供了這么多好處,為什么不是所有企業(yè)都遵循它們?
從對新解決方案的抵制到對可能花費大量實現(xiàn)成本的擔(dān)憂,以及對更新當(dāng)前設(shè)置的需要,自動化可能是壓倒性的。
在接受自動化方面,麥肯錫的一項研究證明,員工擔(dān)心他們會被技術(shù)取代,因此需要謹慎處理這個問題。
同時,自動化帶來了各種好處。但是,在2022年推遲云自動化意味著您的企業(yè)可能會錯過:
- 為企業(yè)的工作負載選擇最佳實例類型和大小。
- 自動縮放云資源以管理需求的上升/下降。
- 擺脫未優(yōu)化的資源以降低成本。
- 通過處理潛在的中斷來改進spot實例。
- 減少存儲、備份、安全等方面的不必要開支。
解決方案是什么?
處理員工與自動化的矛盾是一個老問題,過去的企業(yè)因粗心大意而遭受損失。最好提醒企業(yè)團隊,云自動化將使他們從無聊、重復(fù)的任務(wù)中解放出來,他們可以將精力用于創(chuàng)新。
那么,企業(yè)應(yīng)該如何找到并淘汰未使用的實例?這就是企業(yè)使用自動化的用武之地。
自動化的云優(yōu)化解決方案可以監(jiān)控企業(yè)的云使用情況,以防止效率低下和資源緊湊。它們可以自動淘汰增加云成本的未使用實例和進程。這對所有企業(yè)來說都是一種解脫。



























