您的位置:首頁 > 業(yè)內(nèi)資訊 > 谷歌是如何做到幾乎從不宕機的?
不過目前Google已經(jīng)進入到一個新的階段,它更愿意討論SRE的相關(guān)問題了。(這主要是因為Google想推銷自己的云服務(wù),以便外界公司能夠用上自己的軟件服務(wù)。)不僅如此,Google還專門寫了一本書來探討關(guān)于SRE的問題。
好吧,這本書的名字就是Site Reliability Engineering。此書剛剛被O’Reilly(譯注:一個專注于科技類書籍的出版公司)出版,而來自Sloss的那篇論文被作為此書的第一章。如果你對DevOps感興趣,那么此書在必讀之列;即使不感興趣,這本書的開頭——序言、介紹以及第一章——也足以讓我們了解到Google這個全世界最大的網(wǎng)絡(luò)帝國的驅(qū)動之道。
對于很多科技公司——其實也可以是科技圈之外的所與人——而言,系統(tǒng)管理(或者說運作,隨你怎么稱呼)是收尾工作,是計算機科技最煩人的一個方面之一。但是Sloss,也就是外界所知道的Google內(nèi)部負責“不間斷運行”的副總裁,卻把這個問題反過來看,辯稱網(wǎng)站可靠性“是所有產(chǎn)品最基礎(chǔ)的功能”,畢竟,“如果一個系統(tǒng)不能工作,那么它一點用處都沒有!
黑格爾的對立統(tǒng)一理論
Sloss就是SRE的原點。早年Google招他來負責公司的運營項目時,他創(chuàng)立了這個項目!爱斈阋笠粋軟件工程師去設(shè)計一個運作團隊的時候,SRE就產(chǎn)生了”,他說,“我設(shè)計并管理這個團隊;這個團隊運作起來就像我自己是一個SRE一樣!
Todd Underwood目前是Google的一個SRE總監(jiān);他認為Google雇傭Sloss這樣的碼農(nóng)是一件非常自然的事情。“當Google還處于早期發(fā)展階段時候,就已經(jīng)有軟件工程師很清楚地意識到哪里會出問題以及如何解決這些問題,但是他們中沒有人愿意親自去處理這些事情!
這其實是一件麻煩事。但是Chef的CTO(首席技術(shù)官)Adam Jacob也認為要想成長為一個大體量的公司,做出這種轉(zhuǎn)變也是應(yīng)該的!皩④浖_發(fā)和實際運營連接在一起是一件非常自然的事情,你不可能將兩者自然分開;尤其是當你歷史地看待這個問題的時候,你可能會更加意識到這一點。”
小編推薦閱讀本站所有軟件,都由網(wǎng)友上傳,如有侵犯你的版權(quán),請發(fā)郵件[email protected]
湘ICP備2022002427號-10 湘公網(wǎng)安備:43070202000427號© 2013~2025 haote.com 好特網(wǎng)