中國IDC圈3月2日?qǐng)?bào)道:上周,一個(gè)問題軟件使全球的谷歌(Google)數(shù)據(jù)中心發(fā)生連鎖故障,導(dǎo)致Gmail郵件系統(tǒng)關(guān)閉。
谷歌負(fù)責(zé)工程的副總裁納爾遜•馬托斯(Nelson Mattos)表示,故障發(fā)生在谷歌一個(gè)歐洲數(shù)據(jù)中心的日常維護(hù)期間,是由內(nèi)部編寫的一個(gè)軟件程序的意外副作用引起的。
他稱:“我們不是完美的,我們也會(huì)犯錯(cuò)!
但專家們表示,即使工程精湛程度遠(yuǎn)遠(yuǎn)不如谷歌的企業(yè)IT部門,也應(yīng)能預(yù)測軟件在這種情況下的表現(xiàn)。
IT咨詢公司Gartner分析師麥特•凱恩(Matt Cain)表示:“這根本是不可接受的。這是對(duì)代碼變更考慮不周。在企業(yè)環(huán)境中,你不能只是告訴你的首席執(zhí)行官,這都是運(yùn)氣不佳之故。”
自去年8月以來首次導(dǎo)致Gmail郵件系統(tǒng)全球關(guān)閉的故障開始于上周二。在進(jìn)行日常維護(hù)工作期間,數(shù)據(jù)被轉(zhuǎn)移至一個(gè)備份中心。
然而,數(shù)據(jù)轉(zhuǎn)移觸發(fā)了旨在引導(dǎo)數(shù)據(jù)流向離用戶最近的那個(gè)中心的一個(gè)軟件程序。該程序的本意是為了提高在線申請(qǐng)的響應(yīng)時(shí)間。
由于意外開始處理新的大量數(shù)據(jù),該代碼極大增加了后備數(shù)據(jù)中心的工作負(fù)載,導(dǎo)致過載,使得數(shù)據(jù)自動(dòng)流向第三個(gè)中心。
這隨之導(dǎo)致了另一次過載,最終引發(fā)了一系列失效,就像倒下的多米諾骨牌一樣,使谷歌的數(shù)據(jù)中心一個(gè)接一個(gè)關(guān)閉。 |