新聞源 財富源

2024年11月19日 星期二

財經 > 滾動新聞 > 正文

字號:  

攜程癱瘓“因員工錯誤操作” 稱恢復時間長因技術複雜

  • 發佈時間:2015-05-30 07:17:01  來源:新京報  作者:佚名  責任編輯:羅伯特

   稱恢復時間長因技術複雜,數據和數據庫未受影響;攜程因此將錯失上千萬收入

  5月28日11時起,攜程官網及APP無法使用,直至當天23時29分,才全面恢復正常。經攜程技術排查,確認此次事件是由於員工錯誤操作,刪除了生産伺服器上的執行代碼導致。

  在攜程宕機之前,5月份以來,已有網易、支付寶錢包等網路服務出現短暫的無法正常使用的現象。其中,5月11日晚上8時許,網易突然出現大面積服務癱瘓問題,網易新聞、雲音樂、易信、有道雲筆記等多款移動應用均無法正常刷新,網易名下的遊戲也全線癱瘓,用戶長時間無法刷新和登錄。但第二天淩晨2點就已經恢復。5月27日17時左右,支付寶錢包出現故障。支付寶1小時後就找到故障原因,是杭州蕭山一處光纜被挖斷。

  而攜程此次宕機,從發現到全面修復超過了12個小時。網際網路企業宕機,修復時間如此長的情況,比較少見。

  為什麼恢復時間那麼長?攜程從技術角度對新京報記者解釋道,攜程後臺是一個由SOA(面向服務)架構組成的龐大伺服器集群,一個頁面背後由上千個應用子系統以及上千個Web Service組成,每個應用子系統和每個Web Service之間存在著相互調用的依賴關係。事件發生後,攜程除需要恢復生産伺服器上的執行代碼,還需要確保應用子系統和Web Service的功能正常,以及兩者間的調用關係正常執行。這種驗證性的操作需要反覆地、持續性地調試。

  為杜絕此類事件的再次發生,攜程表示,已經在系統上做了改進,規範並杜絕技術人員錯誤刪除生産伺服器上代碼的操作。攜程再次保證,數據和數據庫並未受到此次事件的影響,用戶訂單數據也完整無損。

  除了消費者,攜程自身受到的影響也非常慘重。以攜程今年第一季度財報的數據計算,凈營收23億元,28日攜程相當於每小時損失106.5萬元的生意。以12小時計算,攜程大約少了1278萬元的業務收入。

  ■ 分析

  網際網路脆弱 企業該做什麼?

  不到一個月的時間裏,主流網際網路企業中,就有網易、支付寶、攜程的伺服器或系統先後“倒下”。對於網際網路賴以生存的網路、設備、技術可能變“脆弱”的情況,企業應該怎麼做?

  安天首席架構師肖新光告訴記者,注意備份、備災非常重要。通常來説,大的網際網路企業都會有比較成熟的備份機制和應急預案等,通常可以做到小故障不影響用戶體驗(甚至讓用戶感知不到),局部故障可以快速恢復等等。

  對於數據,熱備份和冷備份都已經是較為成熟的技術。通俗而言,熱備份是至少兩台設備同時進行相同的數據操作,如果一個設備出現故障,可以快速切換到備用設備。冷備份是指,每隔一段時間進行一次數據複製,來確保一旦出現故障,至少可以恢復到接近當前的某個時刻,但恢復需要更多時間。

  技術與方法等是相對比較成熟的,但同時也要看企業對整個系統的設計是否得當、投入是否足夠、管理是否有效。目前企業的相關投入更多對應的是一些自然事故,如伺服器損壞、線路中斷、包括機房遭遇水災、火災等,但對於惡意攻擊、內部犯罪等防範的能力和防範投入往往還有一定欠缺。

  對於重特大事故和事件(如長期策劃的蓄意入侵攻擊,特別是內部的攻擊),從最開始的一片混亂到有效處理,可能需要更長的時間。多數企業缺少對最壞狀況的演練。同時,如果立足於防範極限情況,也需要付出更多的日常成本。(記者趙嘉妮)

熱圖一覽

  • 股票名稱 最新價 漲跌幅