article banner

阿里雲新加坡資料中心鋰電池爆炸事件

alibaba cloud singapore data center fire - 1
引用自聯合早報

導言:資料中心安全的新挑戰

2024 年,一場突如其來的火災,再次將資料中心的安全議題推向風口浪尖。這次事故的主角,是全球雲端運算巨頭 阿里巴巴集團旗下的阿里雲 (Alibaba Cloud),事發地點,則是在以安全、高效著稱的國際金融中心 新加坡。 阿里雲新加坡資料中心 發生 鋰電池爆炸並引發火災,導致 新加坡可用區 C 網絡異常,部分雲服務中斷長達 35 分鐘, AI 訓練、金融交易 等關鍵應用受到波及。

阿里雲新加坡鋰電池爆炸火災事件,是近年來 首起因鋰電池爆炸引發的重大資料中心火災事故。它不僅 直接影響了阿里雲的服務穩定性與用戶體驗,更 引發了全球資料中心產業對於鋰電池安全性的高度關注。隨著資料中心 儲能系統 中 鋰電池 的應用日益普及, 如何確保鋰電池的安全運營,防範爆炸、火災等風險,已成為資料中心產業 亟待解決的關鍵課題。

本文將深入剖析這起事件,從 火災始末、鋰電池爆炸原因推測、阿里雲服務中斷影響、後續效應與產業反思 等多個層面,抽絲剝繭,還原事件真相,並從中探討 資料中心鋰電池安全管理與消防規範 的關鍵議題,為產業提供警示與借鏡。

火災現場:新加坡資料中心突發火情,濃煙警報拉響

2024 年9月10日早上8點,位於新加坡的 阿里雲資料中心突然發生火災。 資料中心內部火警警報系統立即啟動,濃煙從機房內冒出。

資料中心運營團隊迅速啟動應急預案,疏散機房工作人員,並第一時間通報消防部門。新加坡消防部隊迅速趕到現場,展開滅火作業。

由於火災發生地點位於資料中心內部,機房內精密設備眾多,消防人員需要謹慎操作,避免滅火過程中對伺服器等設備造成二次損害。

經過一段時間的緊張撲救,火勢最終得到控制並被撲滅。(ZMAN補充:實際上燒了33個小時後也還沒撲滅)

alibaba cloud singapore data center fire - 2
引用自8world

起火原因:鋰電池爆炸引發火災,BMS 失效或冷卻異常成疑點

根據事後各方資訊的綜合分析, 阿里雲新加坡資料中心火災的起火原因,基本指向資料中心的儲能系統——鋰電池組發生爆炸。

鋰電池,因其 能量密度高、壽命長 等優點, 在資料中心 UPS (不斷電系統) 備援電源、儲能系統中的應用越來越廣泛。然而, 鋰電池也存在一定的安全風險, 若管理不當,可能發生過熱、短路、爆炸、火災等事故。

對於本次阿里雲新加坡資料中心鋰電池爆炸火災事件,業界普遍推測, 可能的起火原因 與以下幾個方面有關:

  1. 電池管理系統 (BMS) 失效: 電池管理系統 (BMS) 是 鋰電池組安全運行的核心組件,負責 監控電池電壓、電流、溫度 等參數, 防止電池過充、過放、過熱 等異常情況發生。 若 BMS 系統失效,無法有效監控與管理電池,就可能導致 電池過充、過熱,進而引發爆炸、火災。
  2. 冷卻系統異常: 鋰電池在充放電過程中會產生熱量, 資料中心通常會為鋰電池組配備冷卻系統, 維持電池在安全的工作溫度範圍內。 若冷卻系統出現故障,散熱不良,電池溫度持續升高,也可能導致 熱失控,引發爆炸、火災。
  3. 電池品質問題: 鋰電池本身的品質 也 直接影響其安全性。 若電池電芯存在缺陷、生產工藝不良, 可能存在內短路等安全隱患, 增加爆炸、火災風險。
  4. 外部短路或過充: 外部因素 例如 電纜短路、充電器故障、電網異常 等, 導致鋰電池組外部短路或過度充電,也可能引發 安全事故。

綜合來看, BMS 失效 與 冷卻系統異常,被認為是 阿里雲新加坡資料中心鋰電池爆炸火災事件 最有可能的 主要原因。 具體原因仍需等待官方更詳細的調查報告。

影響層面:可用區 C 網絡異常,雲服務中斷 35 分鐘

阿里雲新加坡資料中心鋰電池爆炸火災事件, 直接影響了阿里雲在新加坡區域的雲服務。

根據阿里雲官方公告,受火災影響的主要是 新加坡可用區 C (Singapore Zone C)。 可用區 C 的部分網路設備出現異常,導致 可用區 C 的雲服務出現間歇性中斷。

具體影響包括:

  1. 新加坡可用區 C 網絡異常: 可用區 C 內部及對外的網路連線出現異常, 用戶無法正常訪問部署在可用區 C 的雲服務。
  2. 部分雲服務中斷 35 分鐘: 阿里雲多項雲服務受到影響, 包括 ECS (雲伺服器)、SLB (負載均衡)、RDS (雲資料庫)、OSS (物件儲存) 等。 服務中斷時間約為 35 分鐘。
  3. AI 訓練、金融交易等應用受波及: 部分用戶在阿里雲新加坡可用區 C 上運行的 AI 訓練任務、金融交易系統 等 關鍵應用, 受到服務中斷的影響, 業務運營受到一定程度的干擾。

值得注意的是,此次事故的影響範圍相對本地化,主要集中在新加坡可用區 C。 阿里雲在新加坡區域的其他可用區 (例如可用區 A、可用區 B) 以及全球其他區域的雲服務,並未受到明顯影響。 這也顯示了 雲端服務多可用區架構 在 應對區域性故障 時的 優勢。

後續效應:全球聚焦鋰電池安全標準,消防規範或將更新

阿里雲新加坡資料中心鋰電池爆炸火災事件, 雖然服務中斷時間不長,影響範圍也相對有限,但其 事件性質特殊,警示意義重大, 引發了全球資料中心產業對於鋰電池安全標準的廣泛討論與反思。

本次事件的後續效應主要體現在以下幾個方面:

  1. 鋰電池安全標準爭議升溫: 資料中心儲能系統中鋰電池的安全性, 成為業界關注的焦點。 現有的資料中心消防安全規範,對於鋰電池儲能系統的防火要求,可能存在不足。 業界呼籲制定更完善、更嚴格的鋰電池安全標準, 涵蓋電池選型、BMS 設計、冷卻系統、消防措施、應急預案 等多個方面。
  2. 加速國際消防規範更新: 國際消防組織、標準制定機構 可能會 加速推動資料中心消防規範的更新, 將鋰電池儲能系統的防火安全納入規範範圍, 提升資料中心整體消防安全水平。
  3. 資料中心業者重新評估鋰電池安全風險: 資料中心業者 將 重新評估鋰電池儲能系統的安全風險, 更加謹慎地選擇鋰電池供應商, 加強鋰電池組的日常監測與維護, 提升資料中心應對鋰電池安全事故的能力。
  4. AI 預測性維護技術應用加速: AI 預測性維護技術 在 提升資料中心設備運維效率、降低故障風險 方面的 價值 再次凸顯。 資料中心業者 可能會 加大對 AI 預測性維護技術的投入, 應用於鋰電池組、冷卻系統、電力系統 等關鍵設備的監測與預警, 提升資料中心整體運營可靠性。
  5. 液冷技術或成新趨勢: 液冷技術 在 高密度資料中心散熱 方面 具有優勢, 也更適用於鋰電池組的散熱管理。 阿里雲新加坡資料中心火災事件, 可能加速液冷技術在資料中心儲能系統中的應用普及。

殷鑑不遠:資料中心鋰電池安全管理的啟示

阿里雲新加坡資料中心鋰電池爆炸火災事件,再次提醒我們, 新技術應用在提升資料中心性能的同時,也可能帶來新的安全風險。從這場事件中,我們可以汲取以下啟示:

  1. 安全至上,預防為主: 資料中心安全管理, 必須始終將安全放在首位, 堅持“預防為主,防消結合”的原則。 在鋰電池儲能系統的設計、部署、運維各個環節,都要嚴格把關,消除安全隱患。
  2. 嚴選電池,品質為先: 鋰電池的品質 是 安全性的根本保障。 資料中心業者 應 嚴格篩選鋰電池供應商, 選擇品質可靠、安全性能優異的電池產品。 加強電池入廠檢驗,確保電池品質符合標準。
  3. 智能 BMS,精細管理: 電池管理系統 (BMS) 是 鋰電池組安全運行的 “守護神”。 必須採用高性能、高可靠性的 BMS 系統, 實現對電池電壓、電流、溫度等參數的精確監控與管理。 定期檢查 BMS 系統的運行狀態,確保其功能正常。
  4. 高效冷卻,溫控保障: 冷卻系統 是 保障鋰電池組安全運行的重要屏障。 必須設計高效可靠的冷卻系統, 確保電池組能夠在安全溫度範圍內運行。 定期檢查冷卻系統的運行效果,及時維護保養。
  5. 完善消防,應急有備: 資料中心必須配備完善的消防系統, 包括火災偵測系統、自動滅火系統、排煙系統 等。 針對鋰電池火災的特性,配置專用的滅火設備 (例如滅火毯、水基滅火器)。 制定完善的應急預案,定期演練,提升應對火災事故的能力。
  6. 法規標準,與時俱進: 政府部門、行業協會 應 密切關注新技術發展帶來的安全風險, 及時更新資料中心消防安全規範, 將鋰電池儲能系統的安全管理納入法規框架, 引導產業健康發展。

結語:科技雙刃劍,安全永為先,共築綠色低碳安全資料中心

阿里雲新加坡資料中心鋰電池爆炸火災事件,再次提醒我們, 科技是一把雙刃劍。 新技術在帶來便利與效率提升的同時,也可能伴隨著新的風險與挑戰。 資料中心產業在追求綠色低碳、高效運算的同時,絕不能忽視安全。

我們必須 以阿里雲新加坡火災事件為鑑, 牢固樹立“安全第一”的理念, 持續加強資料中心的安全管理,不斷提升應對新風險、新挑戰的能力。 只有在安全可靠的前提下,資料中心產業才能實現永續發展,更好地服務於數位經濟,造福人類社會。 安全與創新,雙輪驅動,方能行穩致遠。