攜程致歉全面癱瘓:確認係員工錯誤操作所致
- 發佈時間:2015-05-29 10:25:09 來源:環球網 責任編輯:羅伯特
從5月28日中午開始,攜程旅行網開始無法正常登陸,直到23日23:29分才完全恢復正常。
攜程方面向環球網科技表示,經攜程技術排查,確認此次事件是由於員工錯誤操作,刪除了生産伺服器上的執行代碼導致。
昨日上午11:09左右,網友們點擊進入攜程網,頁面顯示404報錯,雖然點擊“返回首頁”後依然可以進入攜程網,但其功能和其他連結均無法使用。
獵豹移動安全專家李鐵軍向環球網科技表示,攜程服務中斷極有可能是內部管理失控導致,通常駭客從外部攻擊很難做到數據大量丟失,且備份還原不至於拖延太久。通常駭客入侵往往只是悄無聲息地拿走核心數據,一般不會進行破壞性操作。攜程這次事故從微網志各方面透露的資訊來看,像內部人員所為(有可能已經造成數據損失),具體損失有多嚴重,只能等待官方的進一步消息。
此外,李鐵軍表示,預防災難性事件發生,需要做兩點:1.嚴格的許可權管理(內控)和災難預防。2.備份:意外發生在最短時間內恢復。
從11:09到23:29,為什麼恢復時間那麼長?攜程方面向環球網科技表示,一般來説,類似攜程這樣的大型網站承載著繁多業務,其後臺是一個由SOA(面向服務)架構組成的龐大伺服器集群,看似簡單的一個頁面背後由上千個應用子系統以及上千個Web Service組成,而每個應用子系統和每個Web Service之間都存在著相互調用的依賴關係。
發生事件後,攜程的技術人員除了需要恢復生産伺服器上的執行代碼以外,還需要做的是恢復並確保每個應用子系統以及每個Web Service的功能正常,同時確保應用子系統與Web Service間的調用關係得以正常執行。
這種驗證性的操作需要攜程的工程師及運維人員通力合作,儘快恢復生産代碼並通過反覆地、持續性地調試以確保應用子系統與Web Service功能的正常運作。
攜程再次保證,數據和數據庫並未受到此次事件的影響,用戶訂單數據也完整無損,請用戶放心並繼續使用攜程網站及App。
如何杜絕此類事件的再次發生?攜程表示,攜程在系統上做了改進,規範並杜絕技術人員錯誤刪除生産伺服器上代碼的操作。(周濤)