尹元,現(xiàn)任“勤智運(yùn)維”京津冀區(qū)域技術(shù)經(jīng)理,曾大量參與企事業(yè)單位運(yùn)維需求調(diào)研與規(guī)劃工作,在運(yùn)維監(jiān)控、流程處理等方面有豐富經(jīng)驗(yàn)。
人工智能是當(dāng)下最火爆的前沿技術(shù),是計(jì)算機(jī)科學(xué)最值得期待的一個(gè)分支,目的是研制出模仿人類思考邏輯和行動(dòng)的智能化機(jī)器??蒲腥藛T嘗試用各種方式讓機(jī)器人替代人類從事差別類型的工作,從最開始的重體力勞動(dòng)到繁復(fù)的精密加工到未來(lái)替代人類進(jìn)行邏輯思考。智能化將大大減輕人的勞動(dòng),以最少的人工干預(yù)完成復(fù)雜的工作。
如果將智能化概念引入運(yùn)維領(lǐng)域?qū)?huì)發(fā)生什么變革呢?我們可以想象一下,用智能化程序代替運(yùn)維人員,能夠在最少的人員干預(yù)下使用故障探測(cè)技術(shù)尋找業(yè)務(wù)運(yùn)行中的故障點(diǎn),發(fā)生故障時(shí)通過(guò)問(wèn)題分析引擎快速定位故障根源尋找解決方案,并能夠自動(dòng)運(yùn)行預(yù)制腳本與工具嘗試進(jìn)行故障的修復(fù),最后還能夠按照袒露出來(lái)的問(wèn)題進(jìn)行深入的關(guān)聯(lián)分析,找出潛藏的隱患并制定解決預(yù)案。智能化運(yùn)維的終極目標(biāo),就是將運(yùn)維人員從繁瑣的工作中解放出來(lái),提高整體運(yùn)維效率,降低運(yùn)維成本,實(shí)現(xiàn)業(yè)務(wù)系統(tǒng)的高可用性。
運(yùn)維環(huán)境的異構(gòu)和復(fù)雜化,導(dǎo)致日常運(yùn)維工作需要付出的人力、時(shí)間成本越來(lái)越高。 2015 年智能化運(yùn)維開始被大家廣泛關(guān)注,隨著大數(shù)據(jù)分析、APM、智能異常檢測(cè)、自動(dòng)學(xué)習(xí)等技術(shù)的興起和逐漸成熟,運(yùn)維需求也逐漸向智能化和自動(dòng)化過(guò)渡。從最初級(jí)運(yùn)維發(fā)展到現(xiàn)在智能化運(yùn)維,可以劃分為 4 個(gè)階段:
1、腳本時(shí)代
運(yùn)維人員通過(guò)手工的方式做設(shè)備巡檢,嘗試著用SSH腳本等方式進(jìn)行系統(tǒng)維護(hù)。
2、工具時(shí)代
運(yùn)維人員使用各廠商推出一些辦理工具,通過(guò)使用這些運(yùn)維工具進(jìn)行系統(tǒng)辦理。
3、平臺(tái)時(shí)代
隨著運(yùn)維工具逐步增多、網(wǎng)絡(luò)環(huán)境異構(gòu)、信息孤島逐漸產(chǎn)生等情況,需要一套統(tǒng)一的運(yùn)維平臺(tái)將工具進(jìn)行整合。
4、智能化時(shí)代
異構(gòu)化環(huán)境,對(duì)數(shù)據(jù)分析和自動(dòng)化的要求越來(lái)越高,借助海量的運(yùn)維數(shù)據(jù)優(yōu)化改進(jìn)當(dāng)前工作方法,日常工作實(shí)現(xiàn)無(wú)人值守的機(jī)器運(yùn)維。建立在大數(shù)據(jù)分析和自動(dòng)化運(yùn)維基礎(chǔ)上的智能化運(yùn)維時(shí)代。
運(yùn)維的精細(xì)化要求越高,就需要積累更多的能力輔助智能化運(yùn)維場(chǎng)景和策略,實(shí)現(xiàn)更多辦理途徑的擴(kuò)展。下面,簡(jiǎn)單舉例來(lái)暢想下一步趨勢(shì)。
1、在平臺(tái)化運(yùn)維系統(tǒng)的基礎(chǔ)上,想要進(jìn)行多系統(tǒng)、多業(yè)務(wù)的整合,僅僅通過(guò)接口遠(yuǎn)遠(yuǎn)不夠,還需要更加深入的數(shù)據(jù)關(guān)聯(lián),模糊業(yè)務(wù)系統(tǒng)與運(yùn)維平臺(tái)之間的界限。
2、更強(qiáng)大的故障探測(cè)能力,能夠深入業(yè)務(wù)多個(gè)層次進(jìn)行故障挖掘,逐層檢索業(yè)務(wù)運(yùn)行數(shù)據(jù),分析業(yè)務(wù)運(yùn)行情況,關(guān)心業(yè)務(wù)關(guān)鍵節(jié)點(diǎn),快速發(fā)現(xiàn)問(wèn)題,及時(shí)通知運(yùn)維人員并啟動(dòng)緊急預(yù)案。
3、故障緊急預(yù)案針對(duì)發(fā)現(xiàn)隱患、異常、告警、故障、預(yù)測(cè)等多種運(yùn)維場(chǎng)景,并提供相對(duì)應(yīng)的解決預(yù)案,可以通過(guò)自動(dòng)或者手動(dòng)的方式快速執(zhí)行。
4、緊急預(yù)案失效時(shí)可以提供大數(shù)據(jù)的強(qiáng)力支持,實(shí)時(shí)分析問(wèn)題根源與可能的故障隱患,提供更加快速、正確的故障判斷能力。同時(shí),提供自動(dòng)學(xué)習(xí)的可能,將現(xiàn)在發(fā)生的故障場(chǎng)景記錄下來(lái)生成新的解決預(yù)案。
5、與流程的結(jié)合,能夠?qū)崿F(xiàn)整體運(yùn)維事件的閉環(huán),提供事件的記錄、跟蹤、處理、反饋等關(guān)鍵節(jié)點(diǎn),保障運(yùn)維工作高效運(yùn)行。
以往的簡(jiǎn)單運(yùn)維,都是通過(guò)彼此獨(dú)立的運(yùn)維工具或網(wǎng)管軟件來(lái)實(shí)現(xiàn)日常辦理,通過(guò)不尺度的數(shù)據(jù)和不統(tǒng)一的告警進(jìn)行人工分析。智能化運(yùn)維能夠?qū)⒏盍训南到y(tǒng)進(jìn)行整合,并提供尺度接口。運(yùn)維整合,表現(xiàn)在數(shù)據(jù)的采集、分析、匯總、處理、總結(jié)、預(yù)案等幾個(gè)層面。
那么,這些又將如何落地呢?一直從事“一體化智能運(yùn)維”研究的勤智運(yùn)維,給出了本身的初步研究成果。