1. 前言
呼叫中心的IT服務(wù)管理一直是困擾IT管理人員的難題,難點(diǎn)在于呼叫中心對IT服務(wù)要求高,涉及技術(shù)門類極其復(fù)雜。以移動通信公司的10086為例,它是數(shù)以億計的客戶和企業(yè)接觸的第一界面,直接代表企業(yè)形像,體現(xiàn)客戶滿意度;而服務(wù)10086的IT基礎(chǔ)設(shè)施又極其龐雜。IT技術(shù)不僅涉及大型數(shù)據(jù)中心需要考慮的網(wǎng)絡(luò)、主機(jī)、存儲、數(shù)據(jù)庫、應(yīng)用軟件,還涉及到普通辦公環(huán)境需要考慮的桌面、終端、外設(shè)等多個層面,另外,還多出了交換、CTI、多媒體等技術(shù)門類。可以說是IT技術(shù)的大雜燴”。移動公司不缺乏管理大型數(shù)據(jù)中心的團(tuán)隊和經(jīng)驗,但是并不能照搬到這樣一個多層次、多類別的IT架構(gòu)上。江蘇移動呼叫中心的IT服務(wù)團(tuán)隊是一個勇于創(chuàng)新的團(tuán)隊,繼2008年3月在全國率先推出支持大規(guī)模駐家座席的技術(shù)平臺之后,在2009年又在終端和服務(wù)器的IT生命周期管理上進(jìn)行了有意義的探索。
2. 初次探索
江蘇移動的呼叫中心支撐著10086和12580兩大類業(yè)務(wù),3個服務(wù)中心分別位于南京和淮安兩個城市,管理著近700臺服務(wù)器和2500臺終端。有限的幾名管理員根本無法同時應(yīng)付諸如此類的繁雜事務(wù)——頻繁的系統(tǒng)安裝、遷移、打補(bǔ)丁;大規(guī)模的應(yīng)用布署、調(diào)整;此起彼伏的故障報修和系統(tǒng)恢復(fù)工作;還有無法預(yù)料的計算機(jī)病毒爆發(fā)和其他安全事件;常規(guī)的設(shè)備采購、資產(chǎn)管理也牽扯了一部分精力。為了保持移動公司的服務(wù)水平,維護(hù)企業(yè)形像,一直以來都依賴維護(hù)人員投入高度的責(zé)任感和加班加點(diǎn)犧牲個人時間來完成任務(wù)。改變不是一蹴而就的,IT人員不斷在嘗試采用不同的管理技術(shù),改變管理方式,以期能夠變被動為主動。從2006年(準(zhǔn)確否?)起我們從多個不同的方向分別進(jìn)行了探索。
2.1. 硬件還原技術(shù)
終端發(fā)生的問題是多方面的,可能是操作系統(tǒng)故障、應(yīng)用程序故障,或者是病毒引起的異常情況。(準(zhǔn)確否?)很多情況下修復(fù)過程很長,操作步驟很復(fù)雜,工作量之大也是不言而喻的。針對形形色色的終端故障,我們采用了一種最簡單的辦法——即采用還原卡技術(shù)。引入還原卡之后,無論終端出現(xiàn)何種復(fù)雜問題,我們都可以立即把系統(tǒng)盤還原到初始狀態(tài),保證座席能夠在短時間內(nèi)恢復(fù)正常工作。這樣一來就解決了終端修復(fù)的大問題。(準(zhǔn)確否?)
2.2. 面向流程的IT服務(wù)管理平臺
我們引入了一套Service Desk服務(wù)管理平臺,通過這套軟件工具來幫助實(shí)現(xiàn)IT服務(wù)的自動化的流程管理。這是一個純管理的工具,工單派發(fā)后還需要人員完成落地的過程。(準(zhǔn)確否?)
2.3. 服務(wù)器和桌面虛擬化技術(shù)
在PC架構(gòu)的系統(tǒng)上我們使用了VMWare來實(shí)現(xiàn)服務(wù)器和桌面的虛擬化;服務(wù)器虛擬化技術(shù)已經(jīng)比較成熟了,能夠大幅提高硬件資源的利用效率,并且可以根據(jù)需要調(diào)整資源和應(yīng)用的相應(yīng)配置,刀片服務(wù)器和VMWare技術(shù)的結(jié)合大大降低了系統(tǒng)硬件成本,同時也降低了管理的復(fù)雜度。
3. 創(chuàng)新提高
可以說,我們在上述方向上的探索是成功的。我們采用的各種技術(shù)手段幫助我們切實(shí)解決了一些具體的技術(shù)難題,并提升了管理的水準(zhǔn)。但是,我們總感覺到這些技術(shù)手段是各自孤立的,它們之間的銜接存在斷層,缺乏統(tǒng)一性,不能完全自動化。但是經(jīng)過一系列的技術(shù)應(yīng)用的鋪墊,我們的思路漸漸清晰,而且尋找到一個合適的契機(jī)。
2008年初以來,呼叫中心多次爆發(fā)蠕蟲和ARP病毒。由于是大面積爆發(fā),IT人員經(jīng)常措手不及。雖然全網(wǎng)部署了防病毒系統(tǒng),而且執(zhí)行強(qiáng)制打補(bǔ)丁的策略,但是,很快就發(fā)現(xiàn)在現(xiàn)有的環(huán)境下無法執(zhí)行。
我們發(fā)現(xiàn),終端雖然打過了補(bǔ)丁,但是由于某種故障發(fā)生以后,使用還原卡對系統(tǒng)進(jìn)行了還原,當(dāng)然新安裝的補(bǔ)丁也被還原”掉了。一旦爆發(fā)蠕蟲病毒,這些還原過的終端很容易交叉?zhèn)魅?mdash;—有些感染病毒的終端還原了而有些還沒來得及還原,這些沒有還原的終端繼續(xù)傳染給還原后沒有打補(bǔ)丁的終端。如果要把還原狀態(tài)設(shè)定為打補(bǔ)丁之后,那么每次打完補(bǔ)丁都需要手工更改還原卡的設(shè)置,而做到這一點(diǎn)幾乎是不可能的。
通過對呼叫中心發(fā)現(xiàn)的這一系列問題的分析,我們發(fā)現(xiàn),無法協(xié)同工作的單一的技術(shù)手段不僅不能達(dá)到終端安全管理的目的,反而帶來了更多問題。
3.1. 基于策略執(zhí)行的主動式終端安全管理體系
而結(jié)合具體情況,我們發(fā)現(xiàn)呼叫中心的大部分是屬于固定工作環(huán)境的高度受控終端,安全策略相對比較容易制訂,但難的是執(zhí)行,也就是自動化的檢查、修復(fù)。因為:第一,策略是需要強(qiáng)制執(zhí)行的,執(zhí)行效果需要循環(huán)評估;第二,策略是不斷完善變化的,制訂策略、發(fā)布策略和執(zhí)行策略必須是一個整體;第三,策略的粒度范圍很大,大到禁止不合格終端接入生產(chǎn)網(wǎng)絡(luò)、禁止使用USB存儲外設(shè),小到禁止某個源IP訪問某個目的IP(黑名單策略)、只允許某個源IP訪問某個目的IP(白名單策略)。
因此,我們提出要建設(shè)基于策略的主動式終端安全”體系,其實(shí)質(zhì)不僅強(qiáng)調(diào)策略制定,更注重是策略自動化執(zhí)行。而且注意不同策略執(zhí)行技術(shù)之間協(xié)同工作。我們考慮使用一個以策略為核心,以制定、檢查和修復(fù)為基礎(chǔ)的三位一體”的技術(shù)架構(gòu):集中的策略制訂、全面的檢查與監(jiān)控、自動化的修復(fù)和處理。
3.2. 融合技術(shù)架構(gòu)—構(gòu)建基于生命周期的終端標(biāo)準(zhǔn)化管理平臺
以解決安全問題為契機(jī),以基于策略執(zhí)行的主動式終端安全模型為基礎(chǔ),我們找到了終端安全、終端管理、備份恢復(fù)”這三個技術(shù)領(lǐng)域形成的一個合集。利用這三方面融合技術(shù)架構(gòu)”構(gòu)建基于生命周期的終端標(biāo)準(zhǔn)化管理平臺,幫助我們實(shí)現(xiàn)基于策略執(zhí)行的主動式終端安全管理體系。
融合技術(shù)架構(gòu)是橫跨安全”、資產(chǎn)管理”、補(bǔ)丁管理”、備份恢復(fù)”、網(wǎng)管”、遠(yuǎn)程控制”等等領(lǐng)域的橫向技術(shù)平臺,那么,把一個融合技術(shù)架構(gòu)放到時間序列里看就是生命周期管理”的領(lǐng)域。
通過呼叫中心基于生命周期的終端標(biāo)準(zhǔn)化平臺的建設(shè),利用其中相互關(guān)聯(lián)的功能模塊,加強(qiáng)了終端防護(hù)能力,提高了終端管理效率,我們簡單列舉幾個有代表性的場景:
場景一
某一臺外來終端可能感染了蠕蟲病毒,此時接入呼叫中心內(nèi)網(wǎng),由于所有內(nèi)網(wǎng)設(shè)備都下發(fā)了統(tǒng)一的策略,這臺外來終端將被所有其他終端和服務(wù)器判別為非法,并被執(zhí)行拒絕訪問策略。
場景二
安全策略遵從模塊發(fā)現(xiàn)部分終端存在安全漏洞,會根據(jù)策略自動啟動補(bǔ)丁修復(fù)模塊安裝相應(yīng)補(bǔ)丁,而在安裝補(bǔ)丁前后會調(diào)用系統(tǒng)備份任務(wù),便于補(bǔ)丁修復(fù)造成系統(tǒng)故障后快速恢復(fù),所有任務(wù)完成后自動報告管理員。
場景三
呼叫中心需要對應(yīng)用程序進(jìn)行一次全面升級。針對不同的操作系統(tǒng)版本需要分別測試、打包、分發(fā)。并根據(jù)當(dāng)前資產(chǎn)信息制訂軟件分發(fā)策略。這一切過程都可以在維護(hù)中心完成。
場景四
有一批新機(jī)器到貨,呼叫中心管理員人員,可以利用快速部署模塊采用定制鏡像方式,根據(jù)不同業(yè)務(wù)需求定制多個系統(tǒng)鏡像,自動網(wǎng)絡(luò)分發(fā)。這樣,一方面,減少新系統(tǒng)和應(yīng)用的部署時間;另一方面,減少非正規(guī)途徑德操作系統(tǒng)安裝和配置引入的外來威脅。
場景五
當(dāng)座席發(fā)生故障需要管理員幫助的時候,呼叫中心的管理員可以掌握該終端的所有資產(chǎn)信息、補(bǔ)丁安裝、配置以及系統(tǒng)日志,便于及時分析問題,而且不用到需要幫助的計算機(jī)設(shè)備前,就可以為座席提供故障判斷及解決、操作幫助等服務(wù)。
3.3. 標(biāo)準(zhǔn)化的終端管理服務(wù)
有了這樣一個三位一體”的終端和服務(wù)器管理的技術(shù)架構(gòu),我們才可以把維護(hù)的各種工具”組合成服務(wù)”,實(shí)現(xiàn)資源的最優(yōu)配置。
IT服務(wù)管理是一個動態(tài)的過程,又是成本和效率和組合。我們割裂地看以上場景就很難形成連續(xù)性,從而忽視管理”本身。可是一旦上升到財務(wù)和業(yè)務(wù)流程層面就很容易聯(lián)系到ITIL——這樣一個曾經(jīng)被流程化、空洞化的概念。作為一個IT運(yùn)營單位,我們更關(guān)注可以落地的技術(shù),而不是空泛的流程和概念。我們在實(shí)踐過程中強(qiáng)調(diào)把融合技術(shù)架構(gòu)自覺地運(yùn)用到整個終端生命周期管理的過程中,同時防止外延的擴(kuò)大化。
在實(shí)踐中我們發(fā)現(xiàn):我們需要終端資產(chǎn)庫,但更多是用于關(guān)聯(lián)事件、關(guān)聯(lián)策略和手段;我們需要服務(wù)流程,但更需要實(shí)實(shí)在在的可以把流程落地的技術(shù)。因此我們在探索、發(fā)現(xiàn)、選擇、檢驗的過程中,直接跳過了各種花花綠綠的概念性介紹材料,通過測試、培訓(xùn)、磨合等一系列過程形成有自身特色的終端服務(wù)管理體系。而這套終端服務(wù)管理體系是有豐富內(nèi)涵的,既有橫向的融合技術(shù)架構(gòu),又有縱向的生命周期管理。
4. 實(shí)踐效果
由于我們把目標(biāo)限定于IT維護(hù)管理的一個小范圍,很快就取得了預(yù)期的效果??梢詮囊韵聨讉€方面體現(xiàn):
安全事件大大降低
隨著系統(tǒng)上線,逐步優(yōu)化使用以來,每天的終端病毒感染量逐漸下降,由原來的每天幾十臺下降到每天5-6臺。大規(guī)模的蠕蟲、ARP病毒在新的架構(gòu)布署以后沒有爆發(fā)過。
下一步我們計劃從源頭上阻止惡意威脅進(jìn)入。
PC利用率大大提高
原來呼叫中心的很多PC因為病毒、硬件故障、系統(tǒng)安裝和配置等各種原因無法使用,隨著系統(tǒng)上線后,病毒問題減少,維護(hù)效率提高,大大提高了PC的利用率。
提高信息內(nèi)容控制的級別
客服系統(tǒng)由于會接觸到敏感的客戶信息,對于信息的保護(hù)一直是管理工作的一個重大目標(biāo),新系統(tǒng)通過采用軟件層的強(qiáng)制手段消除了終端的安全與信息泄漏隱患,如禁止使用USB設(shè)備,禁止訪問與業(yè)務(wù)無關(guān)的網(wǎng)站等。
運(yùn)維效率提高
系統(tǒng)上線前,大量重復(fù)性工作需要管理員人工完成,現(xiàn)在大部分可以通過調(diào)度任務(wù),由系統(tǒng)自動完成,OS部署、軟件分發(fā)、補(bǔ)丁修復(fù)、故障處理所占用管理員的工作量大大降低,運(yùn)維效率提高了。
任何一項創(chuàng)新都離不開實(shí)事求是與客觀的態(tài)度。正是由于江蘇移動信息技術(shù)中心的團(tuán)隊強(qiáng)調(diào)從實(shí)際需求出發(fā)去構(gòu)思,注重實(shí)際環(huán)境的測試,并在實(shí)際生產(chǎn)中運(yùn)用了實(shí)踐和培訓(xùn)相結(jié)合的方法,才能實(shí)現(xiàn)IT服務(wù)水平的提高。