您的位置:首頁 > 業(yè)內(nèi)資訊 > 從“支付寶故障”說起:我們的互聯(lián)網(wǎng)為何如此脆弱?

從“支付寶故障”說起:我們的互聯(lián)網(wǎng)為何如此脆弱?

來源:互聯(lián)網(wǎng)運維雜談 | 時間:2015-06-18 11:52:21 | 閱讀:50 |  標簽: 攜程 支付寶   | 分享到:

1、人與組織

其實這個地方可以談?wù)勀愕娜撕徒M織類型了,領(lǐng)導(dǎo)是否重視IT?是否重視運維?組織是否已經(jīng)認識IT帶來的價值,把IT當(dāng)作自己的一個核心能力來看待?是否把面向用戶的業(yè)務(wù)能力和IT能力很好的對接?是否建立起用戶質(zhì)量的組織文化?等等。

2、流程

流程是梳理多個角色自己的關(guān)系和職責(zé)。我們第一個要去看這個流程在面對故障的是否起到了積極的作用,比如說能夠確保故障信息的準確送達,同時保證處理人的角色和職責(zé)是清晰的。其次不斷去檢查流程是否可以自動化驅(qū)動,而非人為驅(qū)動。人是不可靠之源!我們最終希望形成是一個自動化、標準化的流程,這樣的流程不容易被異化,且能保證預(yù)期執(zhí)行結(jié)果一致。

3、技術(shù)

很多時候大家看到的技術(shù)是運維技術(shù),其實恰恰相反對于互聯(lián)網(wǎng)業(yè)務(wù)來說,對其高可用的影響,必然是業(yè)務(wù)IT技術(shù)架構(gòu),因此在其中需要遵循很多原則,有一些原則需要有普適的參考價值。比如說服務(wù)降級、灰度發(fā)布、過載保護、服務(wù)公共化等等。這些方法論是否已經(jīng)融入到研發(fā)和運維的架構(gòu)設(shè)計哲學(xué)之中?現(xiàn)實是產(chǎn)品功能需求優(yōu)先,而非可運維性優(yōu)先,可運維性最終就是業(yè)務(wù)的質(zhì)量。

4、業(yè)務(wù)管理

把你的IT能力最終都業(yè)務(wù)能力看板化,你可以轉(zhuǎn)換成我們多個業(yè)務(wù)指標,比如說質(zhì)量、可用性、用戶體驗、用戶滿意度、成本等等,有了這些業(yè)務(wù)導(dǎo)向性指標,才能把IT能力和業(yè)務(wù)更好的對接起來。否則很容易在組織內(nèi),形成“IT是支撐部門”認識,而非創(chuàng)造價值部門。這一點還有一個重要性,就是讓IT部門也要足夠的認識到,他們的能力直接和業(yè)務(wù)相關(guān),需要增強業(yè)務(wù)敏感度。

三、如何提高系統(tǒng)的可用性

剛剛上面講到了影響可用性的因素,分成了四個方面,但我想提高系統(tǒng)的可用性從另外一個角度來描述,能把握一些核心準則(其實還有更多)。

1、故障發(fā)生前,建立運維質(zhì)量儀表盤

我們一定要建立運維數(shù)據(jù)看板,這個看板的數(shù)據(jù)并且要在業(yè)務(wù)、研發(fā)、測試和運維達成一致,讓大家足夠重視這份數(shù)據(jù),這樣數(shù)據(jù)便有了推動力。建議這個地方的核心數(shù)據(jù)指標不要太多,因為涉及到多個團隊,大家不能夠一致理解,特別是傳達到管理層,太多的指標,容易失去關(guān)注的焦點。

小編推薦閱讀

好特網(wǎng)發(fā)布此文僅為傳遞信息,不代表好特網(wǎng)認同期限觀點或證實其描述。

相關(guān)視頻攻略

更多

掃二維碼進入好特網(wǎng)手機版本!

掃二維碼進入好特網(wǎng)微信公眾號!

本站所有軟件,都由網(wǎng)友上傳,如有侵犯你的版權(quán),請發(fā)郵件[email protected]

湘ICP備2022002427號-10 湘公網(wǎng)安備:43070202000427號© 2013~2025 haote.com 好特網(wǎng)