《承載IT運(yùn)維成功之夢(mèng):精準(zhǔn)運(yùn)維》要點(diǎn):
本文介紹了承載IT運(yùn)維成功之夢(mèng):精準(zhǔn)運(yùn)維,希望對(duì)您有用。如果有疑問(wèn),可以聯(lián)系我們。
已是一個(gè)星期的晚上沒(méi)睡好了,夢(mèng)里全是啪啪的聲音亂作一氣,一串串紅綠指示燈交替閃爍,我搞不清是夢(mèng)還是在真實(shí)機(jī)房,只覺(jué)得一晚都在忙乎,醒來(lái)已是一身冷汗,這是自從前一段時(shí)間老板命令7*24小時(shí)確保新業(yè)務(wù)穩(wěn)定運(yùn)行,經(jīng)一周苦戰(zhàn)后,總周期性做夢(mèng),揮之不去”.這是一個(gè)有四年工作經(jīng)驗(yàn)的運(yùn)維骨干,也是我書(shū)的讀者,與我交流的心里話,他快崩潰了,總是浮現(xiàn)老板幽幽的眼神,鄙夷的神情暗示他“新系統(tǒng)上線就會(huì)崩,你們這幫吃干飯的”.是呀,生存在這樣的環(huán)境里,這活還有沒(méi)有辦法干,有沒(méi)有辦法改變呢?
我們都知道,IT運(yùn)維服務(wù)是對(duì)IT基礎(chǔ)設(shè)施(網(wǎng)絡(luò)系統(tǒng)、主機(jī)系統(tǒng)、存儲(chǔ)/備份系統(tǒng)、終端系統(tǒng)、安全系統(tǒng)、機(jī)房動(dòng)力及環(huán)境等)以及軟件應(yīng)用等進(jìn)行服務(wù)的.一般情況,我們運(yùn)維信息系統(tǒng),信息系統(tǒng)支撐企業(yè)業(yè)務(wù),而實(shí)際情況是,業(yè)務(wù)受各種因素影響,不斷起伏變化,而沒(méi)人及時(shí)告訴我們?cè)斍?只要求我們以不變應(yīng)萬(wàn)變的方式維穩(wěn),而再牛的公司資源都是有限的,如果運(yùn)維缺乏一個(gè)反饋,既不符合《控制論》的思想,也很難讓運(yùn)維做到有針對(duì)性,更不要說(shuō)精準(zhǔn)了,當(dāng)然也別提運(yùn)維的價(jià)值了.
那么,能不能在運(yùn)維過(guò)程中引入業(yè)務(wù)需求這一變量,讓運(yùn)維更加精準(zhǔn),實(shí)現(xiàn)信息系統(tǒng)與業(yè)務(wù)的心跳同步呢?答案顯然是肯定的.將業(yè)務(wù)需求和業(yè)務(wù)變化作為變量,主動(dòng)將其反饋到運(yùn)維過(guò)程中,讓運(yùn)維工作以業(yè)務(wù)需求為導(dǎo)向、以信息系統(tǒng)為對(duì)象,通過(guò)一系列措施實(shí)現(xiàn)信息系統(tǒng)與業(yè)務(wù)的心跳同步,促進(jìn)業(yè)務(wù)效率、業(yè)務(wù)效益或用戶體驗(yàn)的提升.我們將這種采取新興技術(shù)提供預(yù)防性維護(hù)實(shí)現(xiàn)IT系統(tǒng)與業(yè)務(wù)精確匹配的運(yùn)維方法統(tǒng)稱為精準(zhǔn)運(yùn)維.
精準(zhǔn)運(yùn)維及其意義
1. 什么是精準(zhǔn)運(yùn)維?
大家都熟悉《三國(guó)演義》草船借箭的故事,諸葛亮的成功是有幾個(gè)要素的:首先他熟悉業(yè)務(wù),其次是及時(shí)交流發(fā)現(xiàn)業(yè)務(wù)薄弱環(huán)節(jié)和需求,主動(dòng)提出解決方案,并以意想不到的方式完成.總結(jié)起來(lái),故事的關(guān)鍵點(diǎn)有熟悉業(yè)務(wù)、交流反饋、主動(dòng)服務(wù)、執(zhí)行實(shí)施.
精準(zhǔn)運(yùn)維是一種IT服務(wù)方法,它是要讓IT運(yùn)維服務(wù)工作圍繞被服務(wù)對(duì)象的業(yè)務(wù)來(lái)展開(kāi),從而進(jìn)行心跳同步式的服務(wù),最大限度地利用資源,提升業(yè)務(wù)體驗(yàn),實(shí)現(xiàn)服務(wù)價(jià)值,而不僅僅是圍繞信息系統(tǒng)本身(軟硬件)來(lái)服務(wù).
因此,精準(zhǔn)運(yùn)維的理論體系架構(gòu)本質(zhì)上是以客戶為導(dǎo)向的服務(wù)體系,是以業(yè)務(wù)的心跳為基準(zhǔn)的服務(wù)思想理念.精準(zhǔn)運(yùn)維是通過(guò)一系列方法掌握服務(wù)對(duì)象所使用信息系統(tǒng)的特性、業(yè)務(wù)特點(diǎn),以及該信息系統(tǒng)所服務(wù)的企業(yè)業(yè)務(wù)特性,找準(zhǔn)目標(biāo),通過(guò)業(yè)務(wù)部門(mén)及時(shí)把用戶的真實(shí)體驗(yàn)反饋給運(yùn)維,這樣,運(yùn)維工作就能通過(guò)掌控信息系統(tǒng)運(yùn)行風(fēng)險(xiǎn)、運(yùn)行特點(diǎn)、資源調(diào)配情況和業(yè)務(wù)部門(mén)反饋的意見(jiàn)來(lái)優(yōu)化信息系統(tǒng),從而精準(zhǔn)的預(yù)測(cè)服務(wù)要求并開(kāi)展服務(wù)計(jì)劃,提供和建議使用較小的代價(jià)有效展開(kāi)主動(dòng)服務(wù)和快速響應(yīng)服務(wù)做到信息系統(tǒng)與業(yè)務(wù)心跳同步.
總結(jié)起來(lái),精準(zhǔn)運(yùn)維的基礎(chǔ)是熟悉被服務(wù)對(duì)象,知己知彼,并建立風(fēng)控模型(該風(fēng)控模型與信息安全風(fēng)控不同,見(jiàn)下),其要素是主動(dòng)服務(wù)與預(yù)測(cè),其關(guān)鍵是掌握業(yè)務(wù)需求與變化;與精準(zhǔn)運(yùn)維密切相關(guān)的是業(yè)務(wù)所有者、信息系統(tǒng)、環(huán)境等.同時(shí),精準(zhǔn)運(yùn)維的行動(dòng)離不開(kāi)PDCA的方法.下面,我們可以看看精準(zhǔn)運(yùn)維的框架圖:
精準(zhǔn)運(yùn)維的框架模型就猶如汽車的發(fā)動(dòng)機(jī),要求油門(mén)通過(guò)不斷循環(huán)往復(fù)提供動(dòng)力支撐.
從圖上我們可以看到,上層對(duì)下層是要求,下層對(duì)上層是支撐,影響業(yè)務(wù)的變化主要有六因素;風(fēng)控模型是精準(zhǔn)運(yùn)維的定海神針;與運(yùn)維工作關(guān)系密切的是業(yè)務(wù)所有者、信息系統(tǒng)與環(huán)境;技術(shù)實(shí)力是運(yùn)維工作的支撐.以業(yè)務(wù)目標(biāo)為導(dǎo)向,業(yè)務(wù)所有者(操作人員、維護(hù)人員、管理人員等)以及環(huán)境在信息系統(tǒng)運(yùn)行過(guò)程中所面臨的作業(yè)風(fēng)險(xiǎn)、業(yè)務(wù)風(fēng)險(xiǎn)、政策風(fēng)險(xiǎn)、管理風(fēng)險(xiǎn)和安全風(fēng)險(xiǎn),按照PDCA的方法進(jìn)行風(fēng)險(xiǎn)評(píng)估、識(shí)別、規(guī)劃、執(zhí)行、回顧、改進(jìn)等,從而保持信息系統(tǒng)與業(yè)務(wù)需求的精確匹配,達(dá)到心跳同步.
2. 精準(zhǔn)運(yùn)維的特點(diǎn)與意義
(1) 精準(zhǔn)運(yùn)維的特點(diǎn)
精準(zhǔn)運(yùn)維有別于傳統(tǒng)運(yùn)維,概括起來(lái),有以下五大特點(diǎn):
●以客戶的業(yè)務(wù)為導(dǎo)向.
●服務(wù)要與業(yè)務(wù)精準(zhǔn)同步.
●強(qiáng)調(diào)主動(dòng)性、計(jì)劃性的服務(wù),由救火隊(duì)變?yōu)轭A(yù)防與救火并舉.
●除了保障系統(tǒng)安全穩(wěn)定可靠,更強(qiáng)調(diào)用戶體驗(yàn)、效率和效益.
●更重視服務(wù)價(jià)值的實(shí)現(xiàn).
(2)精準(zhǔn)運(yùn)維的意義
使運(yùn)維服務(wù)過(guò)程更重視用戶體驗(yàn),促進(jìn)DevOps落地
精準(zhǔn)運(yùn)維在服務(wù)過(guò)程中引入了業(yè)務(wù)需求作為控制變量,并以此為導(dǎo)向開(kāi)展運(yùn)維,充分了解了用戶業(yè)務(wù)訴求,并將用戶體驗(yàn)作為最終目標(biāo),這使得運(yùn)維服務(wù)過(guò)程更注重用戶體驗(yàn),擺脫了僅針對(duì)信息系統(tǒng)做文章的小格局,有利于開(kāi)發(fā)(軟件工程)、技術(shù)運(yùn)營(yíng)和質(zhì)量保障(QA)之間的溝通、協(xié)作與整合,促進(jìn)DevOps真正落地.
讓運(yùn)維服務(wù)的價(jià)值更得以突顯,并由“人天”來(lái)衡量轉(zhuǎn)變?yōu)橐云洚a(chǎn)生的價(jià)值來(lái)衡量
傳統(tǒng)運(yùn)維往往簽訂一個(gè)固定期限的運(yùn)維協(xié)議,服務(wù)的價(jià)值一般體現(xiàn)在多少人天、多少人年,以時(shí)間作為標(biāo)尺來(lái)衡量?jī)r(jià)值.而精準(zhǔn)運(yùn)維的目標(biāo)是服務(wù)給客戶帶來(lái)多少價(jià)值并得到客戶的認(rèn)可,體現(xiàn)在精準(zhǔn)運(yùn)維不僅追求系統(tǒng)運(yùn)行安全穩(wěn)定可靠,更追求的用戶體驗(yàn)、業(yè)務(wù)效率、業(yè)務(wù)效益等,這種價(jià)值觀的轉(zhuǎn)變,使服務(wù)的立意更高,目標(biāo)更高、客戶的體驗(yàn)更好,因而含金量也更高.換句話說(shuō),精準(zhǔn)運(yùn)維讓運(yùn)維服務(wù)從低端走向高端,可以走向按項(xiàng)目制、目標(biāo)制來(lái)簽訂合作或服務(wù)要求.
增強(qiáng)了運(yùn)維的主動(dòng)性,使運(yùn)維更加有計(jì)劃性、條理性、預(yù)見(jiàn)性,工作不至于被動(dòng)
很多時(shí)候,IT運(yùn)維服務(wù)帶給人的印象似乎只是停留在“救火隊(duì)員”的角色之上.運(yùn)維人員往往是等到故障已經(jīng)出現(xiàn)或瓶頸已經(jīng)產(chǎn)生,然后才采取應(yīng)急處理措施予以恢復(fù),這種運(yùn)維方法雖然能最終排除故障,但無(wú)法規(guī)避對(duì)企業(yè)業(yè)務(wù)造成的損失.而精準(zhǔn)運(yùn)維主動(dòng)關(guān)注業(yè)務(wù)需要、用戶體驗(yàn)、系統(tǒng)運(yùn)行動(dòng)態(tài)和變化趨勢(shì),并采取措施識(shí)別人機(jī)環(huán)境方面的風(fēng)險(xiǎn)并主動(dòng)采取措施消除,充分體現(xiàn)了運(yùn)維的主動(dòng)性、計(jì)劃性、條理性和預(yù)見(jiàn)性,真正實(shí)現(xiàn)主動(dòng)預(yù)防性運(yùn)維、防患于未然,實(shí)現(xiàn)信息系統(tǒng)與業(yè)務(wù)的心跳同步.
實(shí)現(xiàn)資源優(yōu)化配置、提升資源利用率
IT系統(tǒng)于業(yè)務(wù)應(yīng)用來(lái)說(shuō),有可能資源不足,也有可能資源過(guò)剩,通過(guò)精準(zhǔn)運(yùn)維的方法,不僅能解決資源不足問(wèn)題,還可有效應(yīng)對(duì)資源過(guò)剩的局面,將“閑置”資源充分利用起來(lái).打個(gè)比方說(shuō),一個(gè)營(yíng)銷系統(tǒng)每日的不超過(guò)萬(wàn)條記錄的處理量,但當(dāng)時(shí)設(shè)計(jì)時(shí)卻購(gòu)置了配置很高的服務(wù)器,當(dāng)前的服務(wù)器性能只利用了不到10%.通過(guò)精準(zhǔn)運(yùn)維的分析與評(píng)估,完全可以在當(dāng)前的營(yíng)銷系統(tǒng)服務(wù)器上部署虛擬機(jī),作為其他信息系統(tǒng)的運(yùn)行環(huán)境,企業(yè)無(wú)需再購(gòu)置新的服務(wù)器,從而實(shí)現(xiàn)了資源的優(yōu)化配置,提升資源利用率.
讓運(yùn)維更加向運(yùn)營(yíng)靠攏,成為運(yùn)營(yíng)的一部分
所謂運(yùn)營(yíng),是指以網(wǎng)站為產(chǎn)品營(yíng)銷平臺(tái)或產(chǎn)品本身,為開(kāi)展網(wǎng)絡(luò)營(yíng)銷而做的一系列工作總稱.精準(zhǔn)運(yùn)維不同于傳統(tǒng)運(yùn)維,更為關(guān)注業(yè)務(wù)需求、用戶體驗(yàn),通過(guò)對(duì)運(yùn)營(yíng)過(guò)程中的大數(shù)據(jù)從業(yè)務(wù)角度進(jìn)行精準(zhǔn)分析,發(fā)現(xiàn)用戶的需求與業(yè)務(wù)環(huán)節(jié)的關(guān)聯(lián)關(guān)系,進(jìn)而從應(yīng)用軟件的角度進(jìn)行業(yè)務(wù)模式、流程的改進(jìn)與調(diào)整,讓業(yè)務(wù)更好滿足用戶需要,從而找到新的業(yè)務(wù)增長(zhǎng)點(diǎn)或改進(jìn)方向.從這個(gè)角度來(lái)說(shuō),精準(zhǔn)運(yùn)維讓運(yùn)維比歷史上任何時(shí)候更接近運(yùn)營(yíng),且已成為運(yùn)營(yíng)的一部分,能夠?yàn)殚_(kāi)展網(wǎng)絡(luò)營(yíng)銷貢獻(xiàn)巨大的價(jià)值.
精準(zhǔn)運(yùn)維該怎么做?
1. 精準(zhǔn)運(yùn)維的初始化—建立風(fēng)控模型
了解運(yùn)維系統(tǒng)的業(yè)務(wù)特點(diǎn),根據(jù)業(yè)務(wù)和系統(tǒng)運(yùn)行情況與業(yè)務(wù)所有者一起著手建立風(fēng)控模型.風(fēng)控模型需要體現(xiàn)業(yè)務(wù)所有者(操作人員、維護(hù)人員、管理人員等)以及環(huán)境在信息系統(tǒng)運(yùn)行過(guò)程中所面臨的作業(yè)風(fēng)險(xiǎn)、業(yè)務(wù)風(fēng)險(xiǎn)、政策風(fēng)險(xiǎn)、管理風(fēng)險(xiǎn)和安全風(fēng)險(xiǎn),這些數(shù)據(jù)來(lái)源于信息系統(tǒng)運(yùn)行數(shù)據(jù)、歷史運(yùn)維數(shù)據(jù)、用戶訪談信息及客戶體驗(yàn)信息等.通過(guò)綜合各方面信息,結(jié)合業(yè)務(wù),從而建立風(fēng)控模型,梳理出風(fēng)險(xiǎn)清單.建立風(fēng)控模型的過(guò)程也就是進(jìn)行信息系統(tǒng)與業(yè)務(wù)的匹配度分析過(guò)程,匹配度高的項(xiàng)必然風(fēng)險(xiǎn)小,匹配度低的項(xiàng)勢(shì)必風(fēng)險(xiǎn)高.
要素:風(fēng)控模型的初步建立完成標(biāo)志是與業(yè)務(wù)所有者達(dá)成共識(shí).
2. 精準(zhǔn)運(yùn)維日常運(yùn)行之信息采集與反饋
首先,以風(fēng)控模型為基準(zhǔn),及時(shí)了解業(yè)務(wù)所有者的具體要求并將系統(tǒng)的情況與所有者交流,得到有價(jià)值的服務(wù)信息;其次,可以利用自動(dòng)化監(jiān)控技術(shù)采集到用戶端的用戶體驗(yàn)數(shù)據(jù),如訪問(wèn)網(wǎng)站人數(shù)、登錄系統(tǒng)效率、頁(yè)面響應(yīng)速度、訪問(wèn)流量等;也可以利用大數(shù)據(jù)及最新的ELK技術(shù)的方式采集系統(tǒng)日常運(yùn)行的業(yè)務(wù)數(shù)據(jù)、資源使用情況數(shù)據(jù)、業(yè)務(wù)運(yùn)行效率日志數(shù)據(jù)等.此外,還可以不斷與業(yè)務(wù)部門(mén)進(jìn)行溝通協(xié)調(diào),采集用戶的反饋與需求.
要素:雙方都了解對(duì)方的意圖,并形成共識(shí).
3. 精準(zhǔn)運(yùn)維日常運(yùn)行之預(yù)測(cè)及計(jì)劃編制
根據(jù)采集信息進(jìn)行預(yù)測(cè)與計(jì)劃的編制,所謂預(yù)測(cè),就是對(duì)尚未發(fā)生或目前還不確切的失誤進(jìn)行預(yù)先的估計(jì)和推斷,是現(xiàn)時(shí)對(duì)事物將要發(fā)生的結(jié)果進(jìn)行探討和研究.科學(xué)預(yù)測(cè)是建立在客觀事物發(fā)展規(guī)律基礎(chǔ)之上的科學(xué)推斷.系統(tǒng)預(yù)測(cè)的實(shí)質(zhì)就是充分分析、理解系統(tǒng)狀況發(fā)展變化的規(guī)律.用相關(guān)性、數(shù)據(jù)趨勢(shì)分析法及大數(shù)據(jù)分析技術(shù)對(duì)采集的數(shù)據(jù)進(jìn)行挖掘分析,分析出業(yè)務(wù)需求與資源之間的相關(guān)性、與運(yùn)維人員之間的相關(guān)性,分析出應(yīng)用系統(tǒng)使用的歷史與未來(lái)趨勢(shì),根據(jù)趨勢(shì)與現(xiàn)有資源的匹配性來(lái)實(shí)時(shí)優(yōu)化系統(tǒng)資源和人力資源,并編制詳細(xì)的系統(tǒng)優(yōu)化實(shí)施方案對(duì)系統(tǒng)進(jìn)行優(yōu)化.計(jì)劃即是根據(jù)預(yù)測(cè)和業(yè)務(wù)所有者要求編制的行動(dòng)方案.
要素:計(jì)劃要得到所有者的認(rèn)可,如需要可優(yōu)化風(fēng)控模型.
4. 精準(zhǔn)運(yùn)維日常運(yùn)行之系統(tǒng)優(yōu)化執(zhí)行與實(shí)施
根據(jù)編制的優(yōu)化實(shí)施方案精心組織實(shí)施,且與業(yè)務(wù)方充分溝通,在不影響業(yè)務(wù)的基礎(chǔ)上完成系統(tǒng)優(yōu)化、應(yīng)急演練、風(fēng)險(xiǎn)措施改進(jìn)的實(shí)施服務(wù)工作.
要素:注意行為規(guī)范.
5. 精準(zhǔn)運(yùn)維日常運(yùn)行之校驗(yàn)與評(píng)估
根據(jù)實(shí)施結(jié)果與業(yè)務(wù)運(yùn)行情況及對(duì)系統(tǒng)運(yùn)行情況的采集,不斷的校驗(yàn)實(shí)施效果,再進(jìn)一步評(píng)估改進(jìn),通過(guò)PDCA循環(huán)往復(fù)直至達(dá)到系統(tǒng)與業(yè)務(wù)的精確匹配與心跳同步.
要素:結(jié)果要進(jìn)入下一個(gè)環(huán)節(jié),即反饋給所有者,如有必要可修改風(fēng)控模型.
精準(zhǔn)運(yùn)維實(shí)例
這里我們拿一個(gè)經(jīng)典案例來(lái)說(shuō).大家最為熟悉的微信紅包,在除夕前后會(huì)產(chǎn)生業(yè)務(wù)高峰,大量用戶在同一時(shí)間搖紅包,瞬間產(chǎn)生每秒千萬(wàn)級(jí)的請(qǐng)求,這個(gè)量級(jí)的請(qǐng)求如果不加以疏導(dǎo)處理直接到達(dá)后臺(tái),必定會(huì)導(dǎo)致后端服務(wù)過(guò)載甚至崩潰.因2014年春節(jié)以后,微信紅包業(yè)務(wù)量呈現(xiàn)快速增長(zhǎng),微信后臺(tái)運(yùn)維團(tuán)隊(duì)預(yù)測(cè)2015年春節(jié)的業(yè)務(wù)量將爆發(fā)式增長(zhǎng),對(duì)系統(tǒng)產(chǎn)生巨大壓力.
為應(yīng)對(duì)2015年的春節(jié)業(yè)務(wù)高峰,微信后臺(tái)運(yùn)維團(tuán)隊(duì)開(kāi)展了一系列準(zhǔn)備工作,首先是針對(duì)業(yè)務(wù)建立風(fēng)控模型,以風(fēng)控模型為基礎(chǔ)展開(kāi)下面的工作:
事實(shí)上,按照上述步驟,微信后臺(tái)運(yùn)維團(tuán)隊(duì)在業(yè)務(wù)高峰期到來(lái)前完成了后臺(tái)和APP應(yīng)用在微信紅包功能上的升級(jí),硬件進(jìn)行了相當(dāng)規(guī)模的擴(kuò)容,對(duì)系統(tǒng)運(yùn)行環(huán)境進(jìn)行了全面整改,對(duì)微信紅包模塊支持人員數(shù)量進(jìn)行了補(bǔ)充和技能提升,這對(duì)于最終系統(tǒng)穩(wěn)定高效運(yùn)行提供了有力保障.最終的結(jié)果也表明,精準(zhǔn)運(yùn)維產(chǎn)生了積極的效果.2015年微信發(fā)紅包,除夕搖一搖總次數(shù)110億次,峰值1400萬(wàn)次/秒,8.1億次每分鐘,微信紅包收發(fā)達(dá)10.1億次!驚人數(shù)字再次讓人們好奇,2015年微信紅包方式與去年用戶與用戶之間互發(fā)紅包相比,搖紅包的方式對(duì)業(yè)務(wù)量來(lái)說(shuō)是一個(gè)極大的爆發(fā),光是除夕10:30送出的一波紅包就達(dá)到了1.2億個(gè),已經(jīng)是2014年除夕夜峰值的4800倍之巨(2014年峰值每分鐘被拆開(kāi)紅包數(shù)量?jī)H2.5W個(gè))!
注:上述數(shù)據(jù)來(lái)源于騰訊公司已公開(kāi)信息.
我們?cè)隗@嘆騰訊再次創(chuàng)造奇跡的同時(shí),仔細(xì)想想,微信搖紅包是個(gè)業(yè)務(wù),實(shí)現(xiàn)這個(gè)業(yè)務(wù)的是它的信息系統(tǒng),就是說(shuō)配什么樣的員工、用什么樣的硬件、怎樣的應(yīng)用更合理,需要什么樣的環(huán)境,這些決策都需要基于預(yù)測(cè)用戶的群體意識(shí)和需求,以此為目標(biāo)導(dǎo)向進(jìn)行大數(shù)據(jù)分析和匹配度分析,進(jìn)行資源的優(yōu)化配置,從而實(shí)現(xiàn)微信紅包業(yè)務(wù)的高效運(yùn)行.
作者:李鵬,《IT運(yùn)維之道》作者.
轉(zhuǎn)載請(qǐng)注明本頁(yè)網(wǎng)址:
http://www.snjht.com/jiaocheng/4351.html