您的位置:首頁 > 業(yè)內(nèi)資訊 > 谷歌是如何做到幾乎從不宕機的?

谷歌是如何做到幾乎從不宕機的?

來源:互聯(lián)網(wǎng) | 時間:2016-04-12 13:52:58 | 閱讀:62 |  標(biāo)簽: 谷歌   | 分享到:

某一天,你需要使用Google,但Google并不可用——你上一次遇見這種情況是什么時候?

谷歌是如何做到幾乎從不宕機的?

很有可能,這種情況根本沒有發(fā)生過(譯注:這文章是美國人寫的)。的確,有時也會出現(xiàn)因為網(wǎng)絡(luò)連接中斷而用不上Google的情況;但是Google的基礎(chǔ)性在線服務(wù)——從搜索引擎到Gmail再到Google Docs等等——幾乎永遠垂手可及。根據(jù)Google官方的數(shù)據(jù),2015年該公司旗下的Google App套件在99.97%的時間里都處于可用狀態(tài)。也許我們認為這是理所當(dāng)然的,但它的確是一個了不起的事實;而全世界數(shù)十億的Google用戶似乎從來沒有停下來想想:Google是如何把一件如此激動人心的事情處理得如此波瀾不驚的。

用軟件取代人工

Google用了這三個詞來解釋這個問題:Site Reliability Engineering(中文可譯為:網(wǎng)站可靠性工程,后文簡稱SRE)。也許這三個詞聽起來并不是特別性感,但它們確實是(名字聽起來更不性感)的Google在10年前就已經(jīng)秉承的核心理念。這個理念很難用一兩句話說清楚,不過可以歸結(jié)到一個中心思想:讓碼農(nóng)而非那些專門從事網(wǎng)絡(luò)服務(wù)的IT人士來運營網(wǎng)絡(luò)服務(wù)。如果這個思想得以執(zhí)行,那么碼農(nóng)們就會開發(fā)出一種不需要人為介入的工具來幫助完成運營工作(這里所說的運營,主要是指維護服務(wù)的穩(wěn)定和性能)。

“我們通過這種方法建立這樣一個團隊:大家都比較厭倦自己親自動手去完成任務(wù),而是通過寫出軟件來取代此前需要人工完成的事情!币晃幻蠦en Treynor Sloss的Google員工在一篇文章中寫道。

對于硅谷的很多人來說,這似乎已經(jīng)成為一個常識;從亞馬遜到Box.com,這種方法已經(jīng)被整個科技圈所采用。人們稱其為DevOps(Development加上Operations)模式,意即通過某種努力將軟件開發(fā)者與系統(tǒng)管理員聯(lián)系起來。但是以Chef和Puppet為代表,自從DevOps模式從Google的SRE漸漸衍生出來之后已經(jīng)發(fā)生了很大的改變。只不過Google在過去的十年里一直對SRE默不作聲,但是過去它在應(yīng)對大規(guī)模高效率的網(wǎng)絡(luò)操作時的確是這么做的。

小編推薦閱讀

好特網(wǎng)發(fā)布此文僅為傳遞信息,不代表好特網(wǎng)認同期限觀點或證實其描述。

相關(guān)視頻攻略

更多

同類最新

更多

掃二維碼進入好特網(wǎng)手機版本!

掃二維碼進入好特網(wǎng)微信公眾號!

本站所有軟件,都由網(wǎng)友上傳,如有侵犯你的版權(quán),請發(fā)郵件[email protected]

湘ICP備2022002427號-10 湘公網(wǎng)安備:43070202000427號© 2013~2024 haote.com 好特網(wǎng)