數(shù)據(jù)中心大火波及360萬網(wǎng)站,UPS安全性可靠性亟需關注
作者: 發(fā)布時間:2026-03-27 11:45:00 瀏覽量:
2020年,數(shù)據(jù)中國新建設被中央正式列入新基建戰(zhàn)略。 新基建浪潮的推動加之疫情下數(shù)字經(jīng)濟的高速發(fā)展催生對數(shù)據(jù)中心的新需求,作為新基建的基礎設施,數(shù)據(jù)中心迎來更大的發(fā)展機遇。各地紛紛部署數(shù)據(jù)中心建設,各互聯(lián)網(wǎng)巨頭也競相布局。 以5G、大數(shù)據(jù)、物聯(lián)網(wǎng)、人工智能等新技術、新應用為代表的新基建,在推進疫情防控和疫情后經(jīng)濟復蘇上發(fā)揮了巨大作用,成為適應經(jīng)濟發(fā)展趨勢、推進社會穩(wěn)定發(fā)展的重要引擎。 數(shù)據(jù)是貫穿新基建的生命線,數(shù)據(jù)中心是新基建有序運行的基礎保障,被視為“新基建的基礎設施”、經(jīng)濟高質量發(fā)展的“數(shù)字底座”。 相關單位預測,2025年全球數(shù)據(jù)流量將會從2016年的16ZB上升至163ZB,帶動數(shù)據(jù)中心總體建設規(guī)模的持續(xù)高速增長。 隨著"新基建"浪潮的不斷推進,各行業(yè)的數(shù)字化轉型已成必然趨勢.在此背景下,作為承載數(shù)據(jù)和計算的數(shù)據(jù)中心面臨能耗高,可靠性和安全性以及運維復雜等巨大挑戰(zhàn),亟待變革. 2021年3月10日,歐洲云計算巨頭OVH其位于法國斯特拉斯堡的機房發(fā)生嚴重火災。在OVH在全球擁有27個數(shù)據(jù)中心,其中15個位于歐洲。 OVH迅速的做出了整個事件的應對計劃,但火災造成的損失已經(jīng)難以避免,其托管的許多網(wǎng)站中的數(shù)據(jù)或永久丟失,包括巴黎議室中心額圖書館等多家公司的數(shù)據(jù)恐難以恢復; 圖片1 現(xiàn)場圖片 至于火災原因,目前還沒有正式公布,但多種事實指向了UPS設備導致的一系列故障; 3月12日,OVH cloud創(chuàng)始人Octave Klaba在Twitter上發(fā)布了一個8分鐘的視頻,視頻中稱當消防員到達時,熱像儀檢測到SBG2數(shù)據(jù)中心的UPS7號和UPS8號正在燃燒;他還提到,在火災發(fā)生的前一天,供應商對UPS7號進行了維護,Klaba稱供應商在UPS7號內部更換了某些部件,并在下午重新啟動。 圖片2 現(xiàn)場圖片 此次火災不禁讓人回想起倫敦最大數(shù)據(jù)中心的故障,2020年9月,倫敦最大數(shù)據(jù)中心發(fā)生故障,該事件是由UPS系統(tǒng)故障引起,并在隨后火災警報,該警報關閉了Equinix的LD8數(shù)據(jù)中心,同時還還影響了其它客戶的網(wǎng)絡服務。據(jù)了解,該數(shù)據(jù)中心在2016年7月20日上午曾由于UPS電源系統(tǒng)故障,導致連接其數(shù)據(jù)中心的英國各地的互聯(lián)網(wǎng)中斷,整個倫敦有10%的使用互聯(lián)網(wǎng)服務的客戶由于電源故障而受到影響。 雖然目前OVH并沒有最終公布此次起火的原因是由于UPS引起,但由于UPS在數(shù)據(jù)中心的獨特的地位使得它成為歷次數(shù)據(jù)中心重大事故起因重點嫌疑對象。 在當今現(xiàn)代社會的各個行業(yè)的競爭日趨激烈的形勢下,雖然數(shù)據(jù)中心客戶追求高性價比、高投入產(chǎn)出比無可厚非,但是人們看重效益的同時往往忽略或淡化了UPS最為重要的設計特性,即高可靠性和高安全性,這為數(shù)據(jù)中心生產(chǎn)帶來了非??膳碌臐撛陔[患,它的后果是慘痛的、代價是高昂的。 Eaton作為業(yè)界領先的UPS設計制造商,UPS的安全性,可靠性是我們一貫的堅持和承諾; Eaton與全球重要數(shù)據(jù)中心都有保持長期的合作關系,此次發(fā)生故障的歐洲云計算巨頭OVH和倫敦最大數(shù)據(jù)中心都有使用Eaton 9395系列和93PM系列UPS,在此次事件中正常運行,保持一貫的長期的安全可靠的穩(wěn)定的運行。 不可否認,UPS的特殊結構和工作原理也使得它成為數(shù)據(jù)中心火災發(fā)生的一個重要因素之一。這些重大的災難性事故為我們再次敲響了警鐘,高可靠性、高安全性是UPS設備本身存在的一個最為基本的要素,是不能被忽視的。 從UPS工作原理看,UPS引起的起火及斷電事件中,多數(shù)原因是由于UPS自身設計標準,絕緣距離,關鍵器件的可靠性,散熱系統(tǒng),UPS電氣結構及UPS廠家技術設計能力等引起; 我們以Eaton UPS設計為例,從以上幾個方面一一細述如何實現(xiàn)UPS的可靠性和安全性: Eaton UPS安全性,可靠性設計: 1.設計標準和原則 Eaton作為UPS設計制造全球領先的公司,UPS設計需要滿足中美歐等全球市場對于安全和可靠性的要求,Eaton 9395和93P等系列UPS在全球市場同步銷售,需要同時滿足400V系統(tǒng)和480V系統(tǒng)安全和可靠性設計要求,所以在絕緣間距和線纜選擇上是以最嚴苛的標準來設計。 Eaton一直秉承嚴格要求,堅持全球化高標準的設計,為全球數(shù)據(jù)中心等行業(yè)提供安全可靠的UPS產(chǎn)品,提供可靠的電能質量的保證,助力行業(yè)發(fā)展。 2.高可靠性元器件使用 UPS內部產(chǎn)生積熱在所難免,長期運行下,對內部器件產(chǎn)生影響也在所難免,所以UPS內部器件的選擇就顯得極為重要;特別是與UPS安全性和可靠性相關的關鍵性器件的選擇,需要從設計,材料和廠家資質等方面嚴格篩選。 Eaton 100kW以上機型均采用國際知名廠商IGBT模塊設計,相比分立元件有以下優(yōu)點: √ 抗沖擊能力強, √ 不存在內部單管并聯(lián)均流問題 √ 溫度均勻,散熱好 同時對于對溫度特別敏感,同時與UPS安全性,可靠性設計息息相關的濾波電容器件,Eaton UPS全部導入油浸式電容,替代薄膜電容,杜絕因為材料缺陷而引起的電容冒煙,起火等嚴重事件的發(fā)生。 油浸式電容相比薄膜電容有如下優(yōu)點: √ 油浸式電容,高電壓,高電流,高頻率 √ 高可靠性,IEC61071/UL810認證- 通過嚴酷雙85C 2000小時測試 (85℃/85%RH) √“內置安全分斷設計”,在電容容值異常時自動斷開, 失效安全,沒有冒煙或起火風險 √ 長壽命,額定負載10年以上 3.高可靠性油浸式電容,及其防護裝置和預防性告警 高可靠性器件的選擇,保證了UPS能夠在正常情況下的穩(wěn)定運行,但現(xiàn)場存在各種難以預見的極端條件,Eaton UPS增加了電容的防護裝置和預防性失效預警電容偵測,進一步提升關鍵部件的壽命,降低 UPS 故障發(fā)生的可能性,保證對負載設備的可靠保護; 4.智能風冷調速系統(tǒng),長壽命設計 UPS內部產(chǎn)生的熱量長時間積累下會對內部元器件產(chǎn)生不可逆的影響; 智能風冷調速系統(tǒng)可以快速排出UPS內部產(chǎn)生熱量,減少積熱,減少對熱敏感元器件的影響,進一步提升UPS系統(tǒng)的可靠性和壽命: √ 關鍵元器件電容更換周期10年@ 40C √ 優(yōu)化風道設計 電解電容位于進風口, 低溫度環(huán)境和長壽命; 只有散熱器和電感通過熱風,其余器件(電容和溫度敏感器件)處于 低溫風道。 Eaton 模塊化UPS系列智能風冷調速系統(tǒng): Eaton 可擴展模塊化系列UPS智能風冷調速系統(tǒng): √ 前進風、上出風 √ 避免將機房地板下的灰塵抽入 UPS 機內 √ 尤其在工業(yè)環(huán)境中,可有效避免灰塵沿冷卻通道進入 UPS 內部的電路板、造成短路 √ 獨特的系統(tǒng)設計,熱量較大的功率模塊在頂部,功率模塊的熱量不會影響內部其它器件和線纜,避免功率模塊故障引起更多損壞; 5.冗余設計 高可靠器件的選擇,智能風冷調速系統(tǒng)等從器件和結構方面保證了UPS的安全可靠性,但作為系統(tǒng)散熱的核心部件風扇及其供電的可靠性很大程度上影響了UPS的安全性和可靠性;UPS運行產(chǎn)生損耗,損耗所產(chǎn)生的熱量需要風扇持續(xù)快速的強制排出, Eaton 可擴展模塊化系列UPS,功率模塊,電源板及其取電方式均采用冗余設計,內部模塊化架構支持電源模塊 N+X 冗余,減少斷電風險; 冷卻風扇及風扇電源的冗余設計: √ 風扇是 UPS 的關鍵易損部件,風扇的損壞會導致 UPS 內部工作溫度飆升至保護性宕機,嚴重情況下會引起明火; √ 冗余、在線可更換、潛在故障報警等功能可以有效降低或避免此類故障的發(fā)生 6.故障緊急轉旁路設計 以上的設計及選型,最大程度上保證了UPS的安全性和可靠性,但UPS為數(shù)據(jù)中心提供可靠穩(wěn)定的供電保障,當UPS產(chǎn)生故障時,UPS供電需要緊急轉至旁路,為系統(tǒng)提供最后一道保護屏障,保證系統(tǒng)持續(xù)穩(wěn)定運行,不至于因UPS設備硬件故障而造成用戶系統(tǒng)宕機、重要數(shù)據(jù)丟失等無法挽回的重大損失。 所以UPS故障緊急轉旁路的設計及表現(xiàn)同樣極為重要。 以下對比了Eaton UPS和友商某EXL系列UPS緊急轉旁路轉換時間: 7.損耗密度 電力電子技術的發(fā)展趨勢是高功率密度,但盲目的追求高功率密度是以犧牲散熱面積和絕緣間距為代價的,所以UPS的設計和選型中,不能盲目的追求高功率密度和低占地面積,安全性和可靠性因該為首要考慮因素。 為更好的闡述和理解UPS安全性和可靠性,我們首先提出一個熱損耗密度的概念。 為了更好的表征UPS損耗對UPS散熱能力等影響,Eaton提出了損耗密度的概念,即單位體積內所產(chǎn)生或承受的損耗功率;與功率密度不同的是,功率密度表征單位體積能傳輸?shù)哪芰?,而損耗密度表征的是單位體積消耗掉的能量; 損耗密度可以從安全性和可靠性方面為大家在選型UPS的時候提供另一個角度,同時這也是很多UPS起火的秘密所在—盲目的高功率密度產(chǎn)生高損耗密度,高損耗密度導致積熱嚴重,使得在某些特殊情況下導致UPS損壞,掉載,甚至起火。 我們選取同行業(yè)600k UPS為例作為選型對比,數(shù)據(jù)均來自官網(wǎng): Table 1 損耗密度 從以上數(shù)據(jù)可以看出,Eaton UPS損耗密度是最小的,在同樣都是風冷散熱的條件下,損耗密度越小,由損耗產(chǎn)生的積熱而產(chǎn)生的安全性和可靠性的隱患越小。 Eaton Power Xpert 9395系列可擴展模塊化系列UPS積累了伊頓50年UPS開發(fā)設計和先進制造經(jīng)驗,當前全球裝機容量超過10GVA為全球第一大型UPS品牌,其安全性和可靠性在以下多個行業(yè)領域中得到了廣泛應用和驗證: · 大型數(shù)據(jù)中心 · 大型基礎設施項目 · 金融及銀行業(yè) · 各種大中型工業(yè)領域 · 醫(yī)療保健行業(yè) · 自動控制領域 · 電信通訊行業(yè) 伊頓產(chǎn)品采用全球化的質量管理體系,嚴格管理設計,材料,組裝等關鍵環(huán)節(jié)和工藝,具備高穩(wěn)定性,高可靠性的供電系統(tǒng)。 同時伊頓具備優(yōu)秀的 UPS 運維服務能力,能最大化減少故障發(fā)生,縮短故障處理及設備更換的時長,降低對數(shù)據(jù)和數(shù)據(jù)業(yè)務的影響,并能有效控制機房的運維成本。 目前,在國家政策和巨大需求的推動下,我國數(shù)據(jù)中心掀起了新一輪的建設高潮。數(shù)據(jù)中心投資連續(xù)多年保持高速增長,數(shù)據(jù)中心規(guī)模逐漸擴大。在數(shù)據(jù)中心增長過程中,數(shù)據(jù)中心的安全問題,能耗問題逐步凸顯。數(shù)據(jù)中心供電系統(tǒng)的穩(wěn)定性,直接影響數(shù)據(jù)中心IT設備的穩(wěn)定運行,決定著數(shù)據(jù)中心的安全和服務能力。UPS作為數(shù)據(jù)中心供電系統(tǒng)的核心,發(fā)揮著關鍵作用。 從功率段結構來看,近年來中國UPS市場功率段進一步向大功率遷移,100kVA以上的產(chǎn)品占比進一步擴大,200kVA以上的產(chǎn)品繼續(xù)保持迅猛的增長勢頭。 在保證安全性和可靠性的前提下,大功率UPS設計的復雜度和難度不可同日而語。 同時數(shù)據(jù)中心設備眾多功率大耗電量大;機房線纜多,布線復雜,電氣火災串火快,危害極大;要從根本上避免起火事件,需要從源頭上杜絕此類事件發(fā)生,提高對UPS的安全性,可靠性等方面的認識就顯得極為重要,對機房設施安全的重要性需要給予足夠的重視。特別是當前UPS市場上大功率的UPS品牌和型號眾多,功能特點不盡相同,這為客戶的UPS選型帶來一定的困擾,但無論選擇功能特點、性能參數(shù)的UPS,可靠性和安全性的設計一定是需要首先考慮的因素,不能妥協(xié)。 伊頓UPS堅持一貫的安全性和可靠性設計,從多層次,多方面的安全性和可靠性研究和設計,杜絕UPS自身安全性和可靠性隱患而產(chǎn)生的對數(shù)據(jù)中心等行業(yè)領域穩(wěn)定運行的影響,助力中國UPS行業(yè)成長,助力中國新基建建設。
