事故背景
支付寶擁有超過4萬億年交易總額,是中國第一大第三方交易平台,約占中國整體社會消費金額的六分之一。
2014年年11月,就有用戶反映,支付寶錢包目前無法轉賬和提現,當用戶使用這兩項功能時會提示出現未知錯誤或創建交易失敗,該問題在移動客戶端以及電腦網頁端均存在。
事故經過
2015年5月27日下午4點半左右,陸續有多個地區網友反映,支付寶出現網路故障,賬號無法登錄或轉賬。打開餘額寶後,不能顯示餘額,只能顯示網路無法連結。
2015年5月27日下午5點,擁有將近3億活躍用戶的支付寶出現了大面積訪問故障,全國多省市支付寶用戶出現手機和電腦支付寶無法登入、餘額錯誤等問題。故障發生後,用戶普遍擔心賬戶資金安全問題,亦有用戶反應出現賬戶餘額不同步的現象。
2015年5月27日下午6點半左右,支付寶錢包進入界面之後,顯示“網路繁忙,請稍後再試”的字樣。
2015年5月27日20時10分,支付寶全面恢復正常。
事故原因
螞蟻金服表示,出現這一問題的原因在於市政施工導致杭州市某地光纜被挖斷,影響了支付寶一個主要機房的正常運轉。
對於導致此次事件的原因,螞蟻金服方面的解釋並未獲得金融和網際網路界的廣泛認同。
中國電信技術人士認為,出現這種問題的可能性是,支付寶多個數據中心之間的自動流量切換機制出現問題,只能人工介入。還可能是其他三種原因:一是很有可能是支付寶遭到了攻擊;二是支付寶的路由配置癱瘓了;三是支付寶的雲伺服器癱瘓了,亞馬遜也出現過這個問題。號稱最先進最安全的阿里雲系統對自家業務並沒支撐好。
某大型國企網路運維人員表示,從技術角度看,支付寶此次事故可能是內部套用模組出了問題,未經嚴格驗證的套用被統一升級後,被意外觸發到未知狀態,導致出現此類問題。
事故處理
支付寶官方第一時間回應稱,這是因光纖被挖斷導致大規模故障。
支付寶的官方微博表示:“由於杭州市蕭山區某地光纖被挖斷,造成目前少部分用戶無法使用支付寶,運營商蜀黍正在搶修。支付寶攻城獅正在緊急將用戶請求切換至其他機房,受影響的用戶正在逐步恢復。您的資金安全並不會因此受到任何影響。如果出現交易信息不同步的情況,在修復後會恢復同步。請大家放心。”
2015年5月28日凌晨,支付寶官方發布聲明,對支付寶因光纖被挖斷而斷網事件道歉。支付寶表示,光纜被挖斷可能並不能完全杜絕,但對於支付寶而言,會繼續推進技術的升級改造,繼續完善異地多活的系統架構。未來,即使再次出現光纜被挖斷等意外情況,進行異地切換時,也儘量做到讓用戶最小感知甚至無感知。
事故影響
由於支付寶的在金融領域的系統重要性程度,以及其獨特的基於雲計算的IT技術架構,此次故障受到各方關注。
支付寶底層的基礎雲平台技術,不僅支撐著支付寶,也是浙江網商銀行的基礎,未來還計畫輸出給其他金融機構。因此,系統的安全保障能力更需高標準、嚴要求。
對於此次事故帶來的具體損失額度,螞蟻金服表示,暫時無法統計。
各方評價
質疑焦點有二:一是恢復時間竟然長達兩個小時;二是究竟是出於資金安全考慮而主動放緩速度還是支付寶應急預案出現漏洞。
一位資深的業內專家表示,此次故障事件,給了支付寶反思,但新興事物就是在這種經驗的積累中不斷成長,公眾和媒體對此也應有一定的寬容度。這就像跳水,起跳不錯,空中動作也還行,但入水壓水花不夠好,未來還有改進空間。