為你解讀數據中心的內部電源
現如今,盡管IT業界的各種新興技術可能正發生著各種突飛猛進的快速變化,但每家數據中心仍然需要依賴電力資源的消耗來維持其運行能力。故而,數據中心運營商們仍然需要通過更新電源使用、冷卻和電氣設計方案,來提高數據中心的運營效率。
針對數據中心的能耗
即使當前的整個數據中心行業掀起了整合物理資源,并將部分的IT功能遷移到場外異地的新趨勢,但為數據中心內部的各種設備供電仍然是一項不變的、且成本代價高昂的需求。而與此同時,盡管業界對于能源的需求并沒有改變,但持續減少能耗的方法仍一直在持續的演變著。
在本文中,作者Robert McFarlane將為我們廣大讀者諸君介紹一系列控制冷卻成本的方法,其中包括最近受到廣泛關注的密封遏制(containment)的方法。但是,通往更高效的數據中心運營的最重要一步可能是簡單地確定基礎設施使用的功率,并搞清楚相關的功率到底被用在了哪些領域。這方面的監控和測量工作常常被忽略了,但是這恰恰是發現低效率癥結的關鍵,然后才可以通過采用諸如以更高電壓運行服務器和更新UPS不間斷電源基礎設施的方法來加以解決。
在文章的第二部分中,McFarlane把談論重點聚焦到了選擇恰當的數據中心基礎架構管理系統,以支持朝著更好的功率測量方向發展。而在文章的最后一部分中,Stephen Bigelow則與我們共同探討了另一大流行的話題:直流(DC)電源與交流(AC)電源。盡管目前AC的使用仍然更為廣泛,但他建議數據中心運營商們在某些情況下選擇采用DC可能會有助于提高能源效率。
相信在參閱了本文之后,或將有助于您企業采用現代化的、信息更為全面的方法來解決數據中心供電的老大難問題。
數據中心更高效的電源使用策略
數據中心頭號最重要的需求無疑是電力資源。即使是最有效率的能源之星評級的服務器也需要消耗電力資源,而大多數支持基礎設施也是如此。電力資源是一種昂貴的商品,而且其成本價格還在不斷上漲變得更高,因此數據中心在運營過程中的電力節省無論是在企業財務方面還是在環境保護方面都是有意義的。
傳統上,冷卻系統一致是數據中心所運行的基礎設施中最為低效的部分,僅次于電力使用中的計算設備。近年來,主要的冷卻改進已經顯示出了節能的能力,并且幾種冷卻改進方案已被業界所廣泛采用。而與此同時,在電氣設計中,也已經取得了同樣重要的進步,但大多數技術進步并不是眾所周知的,因此這些新技術的采用普及速度也較慢。而數據中心通過同時利用冷卻和功率技術的改進,可以實現最大幅度的能耗減少。
隨著新的系統和設計技術逐漸發揮其功效,新的最佳實踐方案也開始走到最前列。故而數據中心管理人員們需要更好地了解管理其基礎設施及其處理,存儲和網絡系統的重要性。原因很簡單:它們需要節省電費賬單。對于某些企業組織而言,還可能來自于其對于環境保護的企業負責。通過遵循最佳實踐方案,購買節能型硬件,安裝或升級到最新的電源和冷卻設備,以及對數據中心的所有元素實施恰當的管理,大多數企業組織均可以大幅降低能耗,并提高效益。
測量功率使用,以實現更高的效率
即使到了提高能源效率的理念已經深入人心的今天,大多數數據中心的管理人員對于他們的設施到底使用了多少電力資源仍然并不清楚。
綠色網格組織是一家幫助企業組織節省能源,并履行環保責任的組織,該組織開發了兩項衡量和追蹤節能工作有效性的指標:電源使用效率(PUE)和數據中心基礎設施效率(DCIE)。兩者計算的都是數據中心的所有設備所使用的總功率與計算設備所使用的功率之間的比率。總功率包括計算機、空調和中央機械設備、不間斷電源(UPS)和布線損耗、照明、甚至直接支持數據中心的辦公室所消耗的電力資源。
PUE是用總功率除以計算所消耗的功率得到的比值。運行效率最高的數據中心的PUE值可達1.2至1.5。但不幸的是,大多數數據中心的PUE值仍然在2.5到3.5的范圍內。
DCIE是PUE的反比,即用計算所消耗的功率除以總功率,并且其表現形式為百分比。低PUE數值要比其等效的DCIE比例更令人印象深刻,這可能部分的解釋了為什么PUE目前已經成為業界更加公認的測量效率的方法。
但是,無論數據中心是通過采用PUE還是DCIE來測量其能源效率,都需要獲得進行計算所需要的具體數據,而這在大多數數據中心的操作運營中都是缺乏的。有時,是緣于企業的數據中心建筑與其他建筑共用同一電表,或者是因為電費帳單直接被寄到了企業的會計部門,或者兩個原因均有。由于缺乏有用的數據信息,故而很難了解您企業之前的努力實現的成效如何,以及節能措施如何能夠幫助您數據中心進一步提升效率。
監控功率的使用當然是提高效率的一個重要步驟,但在數據中心的支持和計算系統中,有許多需要優化的領域。例如,無論數據中心所使用的技術類型如何,掌握一臺服務器何時不再被使用了,都絕對有助于實現能耗的最小。這需要更為復雜的監控,而不僅僅是看看總的用電量,并會帶來一系列數據中心基礎設施管理產品的開發。這些產品包括了從單個電源板上監視工作負載的應用程序到能夠跟蹤每款電氣和機械設備乃至計算硬件的系統,以及維護庫存記錄,提供變更控制和布線文檔記錄。
借助冷卻技術實現節能
一旦數據中心通過監測和測量電力使用情況奠定了基礎,那么就到了其提高能源效率的時候了。數據中心在其運營中應該已經遵循了一系列重要的冷卻基礎知識了,例如熱通道/冷通道機柜配置、用沖裁板填充未使用的機架空間、堵住活動地板的空氣通風孔、并清潔舊電纜以改善空氣流量。所有這些步驟措施都有助于減少能源的浪費,但采用更新的技術可以節省更多。
另一種方法是密封遏制(containment)。 通過將冷進口的空氣供應給設備,或供應給設備所排出的熱的廢氣,使冷卻得到改善,增加了空調的容量能力并且節約了能源——所有這些僅僅是通過在熱通道或冷通道周圍添加屏障。 但是當您數據中心采用密封遏制措施時,請務必注意遵守最新的國家消防協會標準的要求。 千萬不能堵住噴頭或氣體系統的接口。
根據美國采暖,制冷和空調工程師協會的TC 9.9標準,將設備入口溫度提高到75至80華氏度(24至27攝氏度)之間也可以節省大量的電力資源。而如果您的數據中心采用了使用密封遏制的方法的話,這將變得更加有效。
在冷卻設備上使用變頻驅動器(VFD)是另一種提升能源效率的方法,該方法將冷卻考慮與更新的電氣設計技術相結合。設置適當的傳感器(溫度、壓力、速度和濕度)的驅動頻率。這反過來,能夠控制風扇、轉速壓縮機、水泵、冷卻機組和冷卻塔的速度,以符合實際的需要。當電機轉速降低時,能量消耗急劇下降;將VFD與電子換向電機(electronically commutated motors)相結合,可以節省更多。此外,借助變頻器,您數據中心可以以較低的總功耗持續運行冗余冷卻。這是一個真正的雙贏局面。
提高能源效率的電氣方面的考慮事項
還可對數據中心的電力基礎設施進行其他方面的更改,以降低能耗。
計算機電源在較高的電壓下(例如,在208伏電壓而不是120伏電壓情況下)能夠更有效地運行,甚至大多數傳統硬件可以自動感測。在機柜運行三相電路(特別是高密度的機柜)通常是提供208 V電源的最有效的方式,并且還為負載增長提供最大容量。208 V電路需要兩相導線,但通過運行只有一個額外的導線運行一款三相系統的所有三相導線,將獲得三條208 V電路。如果您數據中心仍需要幾條120 V電路,還要安裝第四條中性導線。在現有數據中心,為208 V接線新機柜,并升級剩余機柜的機會正在出現。
即使是更高的效率,加上簡化的操作,也可以通過使用歐洲415 V / 240 V電源標準獲得(通常稱為“400伏”)。這個標準在四根電線上為設備提供240 V的電源(相同的三相電線加上一個美國標準的208 / 120 V系統中性線)。計算機電源在240 V比在208 V條件下更有效地運行,但歐洲的配置更多的優勢在于其能夠更容易的相位平衡。相位平衡需要重新插入負載,將它們從一個相位遷移到另一個。這在240 V電壓下更容易執行,其中的負載移動一次只在一個相導線,而在208 V電壓下,則需要移動三個相位的其中兩個,直到達到一個平衡的組合。
使用一個可擴展的UPS基礎設施也可以有助于減少能耗。這種方法盡可能只提供所需要的電力資源量,但其可以隨著電力負荷的增加很容易地實現擴展??蓴U展的UPS系統讓您數據中心得以能夠根據實際需求增加容量,無論是通過插入額外的模塊的形式或是通過軟件控制解鎖額外的內置容量。通過將讓UPS容量與實際負載相匹配,您數據中心能夠始終保持在UPS負載曲線最有效的部分運行。這在2N冗余架構設計中尤為重要。
另一種備用電源系統是飛輪UPS。在該裝置內部是一個沉重的、不斷旋轉的輪,其存儲動能,而不是使用電池來存儲電能。當公用供電電源發生故障時,電力繼續產生,直到飛輪減速,這通常需要20到45秒的時間。飛輪有時與電池一起使用,以最小化電池消耗。這在經常發生短時間的電源中斷的地方特別有用,因為電池的使用壽命會因為多次的放電和再充電而降低。
“Eco模式”的UPS也正在越來越多的受到業界的歡迎。他們宣稱不管負載水平如何,均能夠達到98%至99%的效率。與更常見的、將輸入的交流(AC)公用供電電力轉換為直流(DC)然后回到AC的雙轉換UPS不同,一款Eco模式的UPS在大多數時間在過濾的公用供電電力上運行計算設備。當輸入的公用供電發生故障失敗,或電壓下降到低于可接受的水平(例如局部暫時限制用電)時,Eco模式的UPS系統能夠迅速地切換到完全雙轉換模式,使得計算設備不會經歷斷電問題。
并不是每家數據中心都能夠很好的適應這種技術,鑒于數據中心運營商們需要關注輸入的電源功率是如何更好的過濾的;以及高性能的計算設備需要什么級別的功率穩定性,以避免故障,數據丟失或內部損壞。然而,在現代服務器中所供應的電源,具有其自身的隔離和幾秒鐘的穿越功率,所以,隨著能源效率變得越來越重要,我們或將能夠看到更多的Eco模式的UPS系統。還應指出的是, 任何數據中心供電系統都應包括浪涌保護(surge protection),特別是在Eco模式的UPS和雙轉換系統的旁路。浪涌保護器(Surge protection Device,簡稱SPD),不會提高能源效率,但如果雷擊或惡劣的功率激增的情況發生,他們可以幫助節省許多倍的成本。
最后,較之交流電源,現如今直流電源被發現越來越多的為數據中心業界所廣泛接受,以作為一種減少能源消耗的方式。交流為長距離輸送電力資源提供了最好的方式,但在所有的電腦中,交流電源必須轉換為直流電源以便運行電子元器件。因此,如果您數據中心將輸入的建筑功率轉換為380 V的直流電源,這已成為事實上的標準,您可以消除對于將將直流轉變為交流的UPS逆變器的使用,同時還能夠消除大多數的服務器電源。消除兩種電源的轉換應該有助于提高數據中心的整體效率,但實際的效率是否獲得增益仍然是一個備受爭論的問題。此外,較之交流電,使用直流電需要更多的關注電路負載,故而使用直流電并不一定適合所有的數據中心。
數據中心的運行不能沒有電力,但通過良好的設計和周密的管理,數據中心可以消耗更少的電力資源。
為您的數據中心尋找合適的DCIM系統
在今天的數據中心行業中,最熱門的流行術語可能非數據中心基礎設施管理(DCIM)莫屬了?,F如今的幾乎每款產品似乎提供了某種DCIM功能,并且還有幾款獨立的DCIM系統聲稱能夠覆蓋一切。但DCIM到底是什么?其到底應該做些什么呢?
數據中心基礎設施管理監控工具的出現,引發了一些問題。什么因素使得DCIM對您的企業是有價值的呢?其是否會有助于提高您企業的盈利能力呢?其能否執行您企業最初所需要的一切工作需求,并能夠隨著您企業的發展一起成長呢?部署實施DCIM及保持其更新需要花費您數據中心工作人員的多少工時呢?這些都是在您數據中心選擇采用任何一款DCIM系統之前,所需要詢問您的供應商,并問問您企業自己的問題。
早期的DCIM是關于管理樓層空間,跟蹤資產。電源使用效率(PUE)的度量推動其成為了一款更為全面的用于監控整個數據中心的基礎設施的工具。如果您的數據中心真的關心的數據中心的能源效率,提高PUE值,并節約能源成本,那么您將需要掌握關于您數據中心的全方位的電力和冷卻信息以及資產管理信息,而這些信息均可以儲存在一款DCIM系統中。鑒于當前業界的減少能源消耗使用和節約成本的挑戰壓力,那句老話:“您無法對您不能測量的的設備實施管理!”從未沒有變得如此真實。
對于許多一般性的數據中心而言,掌握操作空間的室溫數據、機架功率電源消耗數據和不間斷電源(UPS)的報警數據、以及空調故障數據就足夠了。而來自多家硬件和軟件供應商的DCIM選項有多種形式——從制造商的智能插座板,計算機室空調(CRAC)和濕度傳感器到資產跟蹤和機柜安全訪問,并許多將這些基本參數集成整合為一個成本效益數據包,以便可以實現更多的效益。但是對于大型數據中心設施而言,特別是對于那些想要跟蹤PUE值,并最大限度地提高能源和計算使用效率的企業,掌握更多的信息則是必要的。
您數據中心可以從每家供應商那里部署采用離散的DCIM方法——獨立的UPS和空調單元、機架電源、中央冷卻設備、發電機和資產管理。但是以這種方式創建一個主要的DCIM系統將導致一系列顯示、報告和數據列表的混亂,甚至某些數據可能會重疊并且變得不方便。更可能的情況是,大多數系統將被淘汰,導致大量的資金花費在技術上,但卻沒有收到管理的益處。
現在,數據中心中的一切都是相互關聯和相互依賴的。隨著處理器使用的增加,服務器獲得更多的功率,然后減少計算負載。這影響了數據中心的冷卻要求,在較新的數據中心設施中,應該通過具有變速控制的空調提供冷卻。這些反過來又會引起泵速,冷卻器容量和冷卻塔操作的變化。在設計良好的基礎設施中,這一切都應該自動平衡,但仍需要實施監控,以確保其正常工作。
來自DCIM系統的信息應該還有助于確定如何在數據中心內部部署和使用計算硬件,以便盡可能實現高效地運行。假設您的冷卻設備可以處理集中的刀片服務器,但只有在當CRAC以最大速度運行時才行。采用不同的部署方法可能會使用消耗更少的能量,但除非您可以看到這條鏈上的所有設備的功耗和操作點,否則您是不會知道的。同樣,除非您數據中心可以對替代品進行模擬建模,看看其真實的意義,否則您無法知道能夠做些什么以便改善操作。
簡而言之,DCIM在數據中心的角色作用的顯著擴展,也使得其復雜性隨之明顯增加,故而企業數據中心需要采用一套良好集成的解決方案。
集成DCIM系統的要求
在考察現代的DCIM方法時,有兩項主要的事情需要考慮:通用性和數據處理。
真正通用的DCIM產品必須滿足兩項大的要求。首先,系統必須能夠連接到空調、UPS系統、電源插座、電源配電單元、服務器、冷卻機組、水泵、溫度濕度和壓力傳感器、電表、冷卻塔、發電機、電池監控器、照明控制、消防和安全系統、計算硬件以及與數據中心的操作有關的任何其它事物。第二,其必須在執行上述所有這一切時是與供應商無關的。必須無縫連接到每家制造商的硬件,并將所有可用的數據信息傳遞給DCIM系統,具有完全透明性??紤]到數據中心的復雜基礎設施中的所有不同設備以及所使用的各種數據和報警協議,這可能是相當困難的。
當然,一款完整的DCIM系統還應包括跟蹤資產的基本能力。
在選擇一款DCIM系統時所需考慮的第二大要求是數據處理。DCIM廣泛的擴張帶來了數據爆炸。如果您數據中心真的測量和跟蹤了數據中心的所有方面,那么您將所獲太多的數據任何人都無法完全吸收。大多數數據中心設備現在都是網絡連接和IP可尋址的??照{和UPS系統可以提供多達256個數據點。較新的計算硬件可以就內部溫度、空氣流、風扇速度和處理器利用率等方面生成大量的測量數據。
這些數據量遠遠超出了您的預期——或者遠遠超出了您所實際關注的領域——除非您是一家制造商,需要隨著時間的推移收集設備的磨損,性能和能源效率的歷史數據。對于普通用戶來說,這些大部分數據是無意義的。
但是,您數據中心的DCIM系統需要捕獲它,以避免丟失對您重要的參數。
那么,您要如何處理每天所收集的大量數據呢?將所有這些數據轉換成信息,就是區分一套及格的解決方案和好的解決方案的差別所在了。為了能夠作為管理工具而發揮作用,所有物理,電氣,機械和操作方面均需要集成,并做到以下幾個方面:
通過圖形化的突出顯示,指示異常和操作參數的變化,以便在其發生之前,提醒您潛在問題。
具備快速演示,并容易地深入探索的能力,以便獲取有關任何條件的更多詳細信息,其應以清晰的圖形格式提交顯示原始數據。
這肯定是一個具有挑戰性的任務。隨著各種的設備類型和制造商組成一處現代的數據中心,僅僅只是顯示漂亮的3D圖片、以及在問題已經發生后,才發出警報是遠遠不夠的。重要的是,對于實施操作管理所必要的全部信息是否都是在第一位的。只有這樣,才能考慮以3D圖片顯示是否提升了人們的理解,并使用戶得以能夠更快的掌握相關的意義并采取行動。
關于DCIM系統的更多優點
在確定了您數據中心的DCIM系統涵蓋了上述基礎層面之后,您可以繼續研究構成全功能的DCIM系統的其他三個選項。
- 了解您數據中心是否可以運行“假設”場景來查看添加設備的效果,或者查看如果基礎架構中的某些內容發生故障,會導致什么情況。在規劃在何處安置新硬件時,這可以說是相當有幫助的。一些系統甚至具有計算流體動力學(CFD)集成。由具有空氣流量和CFD系統的相關知識背景的人員來解釋正確構造的CFD模型可以是相當有價值的補充。然而,輸出數據的質量取決于輸入數據的質量。CFD模型可以被構造為顯示任何事物的好或壞,因此當其作為DCIM部署的一部分時,必須定期對照實際的條件進行驗證。
- 該系統還必須能夠增長并適應未來的需求。數據中心總會有新的硬件和持續不斷涌現的關于現代化的數據中心基礎設施的新的方法和技術,故而DCIM系統應該能夠整合您企業的未來需求。理想情況下,這可以通過模塊化的方法完成,要求您在開始時只購買所需的零件組建,并根據需求的變化以協調的方式增長。
- 最后,關于數據中心最初創建時的基本信息,數據庫,圖形,并持續支持對其實施維護更新的需求。許多DCIM系統被淘汰的原因就在于數據中心工作人員無法使其保持更新。
現如今,沒有某種形式的DCIM,甚至即使是運行一處小型的數據中心也變得不切實際。僅僅依靠設備顯示面板的報警和零星讀數是不夠的。您數據中心需要問問自己需要監控多少設備,需要監控哪些資源的消耗,并保持所需的控制級別。如果基本監測是必要的,那么比您最初所需要監控的范圍監控更多,可能是更好的;畢竟,您企業的需求會隨著時間的推移而增加。
但是,如果您知道您需要一套完整的數據中心基礎架構管理工具來處理主要操作,那么,在確保所有必要的接口都是可用的之后,最重要的是要將數據轉換為有價值信息,并以恰當的形式顯示。
數據中心的直流電源與交流電源
但涉及到數據中心的的直流電源與交流電源的討論時,很顯然雙方都有為數不少的支持者。如下,我們將為大家介紹數據中心在采用時所需考慮的注意事項。
全球的電網是以交流(AC)而不是直流(DC)的形式分配電力。 對于交流電源的選擇可以追溯到19世紀,彼時,托馬斯·愛迪生開始第一次吹捧DC的簡單性,而像喬治·威斯汀豪斯和尼古拉·特斯拉等人則都支持AC的使用。由于AC被證明更容易在遠距離交付商業用電,而且其所使用的銅線更薄、更便宜,故而該行業最終選擇采用AC。
然而,交流電源并不一定是輸送功率最有效的手段,而數據中心機架和系統使用直流電源則是緣于電力成本的因素迫使企業組織壓縮電力預算而已經獲得了不少的關注度。下面,讓我們來考慮一下在直流電源交付中所存在的幾個關鍵性的問題吧。
什么是直流電源?
交流電源的問題是損失。交流電最初離開一處發電廠時是具備非常高的電壓的。而當這些電壓被逐步輸送到城市、城鎮和個體建筑時,那些高電壓被通過采用變壓器分割了幾次。甚至一旦有600 VAC或480 VAC的交流電壓進入建筑物時,其必須被再次降低到240 VAC或120 VAC以供應給機架服務器的電源,將交流轉變成直流電壓,這些功率將服務于幾款組件,如處理器、內存、硬盤等。
交流到直流的轉換是不完美的,并且在每一次轉換過程中都會有一定量的損失發生。但您已經為進入到您的設施內的所有的電力支付買單了,無論這些電力資源是被您企業充分使用了或是損失掉了。直流電流的支持者們認為,從交流到直流的一個單一的轉換將消除這方面的損失,而且是更有效的。將所得的直流電源將被分配到整個數據中心的機架和系統,取代傳統的交流電源布線和子系統。
直流電源的好處
轉換到直流電源的一般性的好處是提升效率和節約成本。這個概念很簡單,您數據中心將通過消除在轉換過程中損失的電力資源來節省資金。加利福尼亞的伯克利勞倫斯國家實驗室曾經在2006年進行過一個示范,比較了數據中心的交流和直流電。該實驗室聲稱,數據中心通過使用直流配電可以節省高達20%的電力成本。
此外,在個別服務器或其他硬件系統上的電源供應基本上被移除,因為電源已經以直流的形式到達了機架,可以根據需要調整到較低的電壓。這消除了對多余電源的需要,同時還消除了他們所產生的噪音和故障多發的冷卻風扇。
通過直流配電所帶來的實際節省的電力資源量仍然是一個備受爭論的問題,并且之后的由諸如綠色網格組織所進行的測試質疑了數據中心采用AC和DC供電之間的最終區別。例如,綠色網格組織的報告得出結論說,配電方法之間沒有顯著差異——主要是因為在每個可能的負載條件下,沒有單個的AC或DC配置更高效,并且服務器和配電設備也在持續變得更高效。
然而,當實現節約時,對于最大型的數據中心運營商來說,處理多兆瓦安裝的實際利益將是最大的。今天,諸如谷歌和瑞士主機托管公司green.ch等巨頭都采用的是直流供電的數據中心部署。
更新數據中心以支持直流電源
直流電采用的最大障礙之一是,該技術具有高度破壞性。這不是簡單的將電力資源從交流轉換到直流。一個直流電源驅動的數據中心需要一個完全不同的配電系統和布線的機架。配電還需要集成現場發電機,以便使得備用發電機的電源轉換為直流電源以供應給相應的設施。
改造工作可以直接對服務器和系統進行。但現有的服務器和其他硬件系統則不能為直流電源進行改造,因此需要一套完全不同的硬件。不間斷電源系統依賴于AC到DC的轉換來為內部電池充電,而逆變器將直流電轉換回交流電,需要更換為直流單元。故而企業組織通常會等到構建新的數據中心時才開始部署直流電源。
隨著能源成本和業務可用性需求的不斷上升,確定直流與交流電源之間誰將贏得最后的斗爭是很重要的。最終,用直流電力基礎設施取代傳統的交流配電方案可以通過消除額外的功率轉換減少能源損失。如果使用得當,還可以幫助數據中心節省每月的電費,并免去單獨的電源簡化設備,從而進一步的降低成本和提高可靠性。






















