您的位置:首頁(yè) > 業(yè)內(nèi)資訊 > 谷歌是如何做到幾乎從不宕機(jī)的?

谷歌是如何做到幾乎從不宕機(jī)的?

來(lái)源:互聯(lián)網(wǎng) | 時(shí)間:2016-04-12 13:52:58 | 閱讀:105 |  標(biāo)簽: 谷歌   | 分享到:

Chef公司的Jacob認(rèn)為這里所提到的50%的比率并沒(méi)有那么重要,但是他喜歡這種態(tài)度。他說(shuō)“那是業(yè)務(wù),總要有人去處理運(yùn)營(yíng)工作;而且運(yùn)營(yíng)工作幾乎是無(wú)窮無(wú)盡的,所以你硬要給他們扣上一頂帽子也是可以理解的!

在雇傭SRE時(shí),Google甚至制定了嚴(yán)格的規(guī)范。在招募的人員中,有50%到60%的人員會(huì)通過(guò)像其他所有Google工程師那樣的嚴(yán)格考核,剩下的需要擁有85%到99%的Google工程師技能,加上一些特殊適用于SRE但是大多數(shù)軟件工程師不具備的技能——比如說(shuō)對(duì)于UNIX操作系統(tǒng)和硬件網(wǎng)絡(luò)協(xié)議了如指掌等。這些都是為了保證開(kāi)發(fā)和運(yùn)營(yíng)之間能夠保證一個(gè)恰當(dāng)?shù)钠胶狻?

SRE的雄心

從多種層面上而言,這是一種全新的理念。但是在他的書(shū)中,當(dāng)他們?cè)噲D描述這種理念的時(shí)候,Google團(tuán)隊(duì)卻選用了一個(gè)比較老舊的例子。Google SRE的精神先行者是一個(gè)來(lái)自MIT的名為Margaret Hamilton的程序員,她在六十年代為阿波羅飛船編寫(xiě)了登月程序。正如Hamiltion自己說(shuō)的那樣,阿波羅項(xiàng)目中衍生出的部分文化是向所有人和所有事物學(xué)習(xí),包括那些看起來(lái)學(xué)不到什么的人和事。

雖然Hamilton是一個(gè)碼農(nóng),但她在運(yùn)營(yíng)中承擔(dān)重要角色。為了證明這一點(diǎn),這本書(shū)中講了一個(gè)故事:她經(jīng)常帶她的女兒Lauren進(jìn)入到計(jì)算機(jī)實(shí)驗(yàn)室,有一天,Lauren恰好碰到一個(gè)按鈕,然后把阿波羅的預(yù)發(fā)射程序植入到一個(gè)正在運(yùn)行“發(fā)射后場(chǎng)景”程序的計(jì)算機(jī)中去。

這一下讓整個(gè)系統(tǒng)卡死;Hamilton試圖在系統(tǒng)中添加一段錯(cuò)誤監(jiān)測(cè)代碼,以便在真實(shí)的飛行過(guò)程中能夠阻止這種錯(cuò)誤。她的上司否決了整個(gè)想法,辯稱宇航員絕不會(huì)犯這種錯(cuò)誤;但是在阿波羅8號(hào)中,宇航員的確犯了這么一個(gè)錯(cuò)誤。幸運(yùn)的是,Hamilton在系統(tǒng)文檔中加入了一個(gè)變通方案。在后續(xù)工作中,她還是加入了這段錯(cuò)誤監(jiān)測(cè)代碼。

如果你過(guò)來(lái)跟我說(shuō)“它會(huì)死機(jī)”,那沒(méi)有什么用;但是如果你說(shuō)“它會(huì)死機(jī),讓我來(lái)告訴你怎么解決”,那你就很棒了——Underwood說(shuō)!岸谖覀冞@里,會(huì)有人既知道會(huì)出現(xiàn)一些問(wèn)題,也知道問(wèn)題出在哪里,并且能找出方案防止問(wèn)題發(fā)生!

小編推薦閱讀

好特網(wǎng)發(fā)布此文僅為傳遞信息,不代表好特網(wǎng)認(rèn)同期限觀點(diǎn)或證實(shí)其描述。

相關(guān)視頻攻略

更多

掃二維碼進(jìn)入好特網(wǎng)手機(jī)版本!

掃二維碼進(jìn)入好特網(wǎng)微信公眾號(hào)!

本站所有軟件,都由網(wǎng)友上傳,如有侵犯你的版權(quán),請(qǐng)發(fā)郵件[email protected]

湘ICP備2022002427號(hào)-10 湘公網(wǎng)安備:43070202000427號(hào)© 2013~2025 haote.com 好特網(wǎng)