在過(guò)去的兩年里,企業(yè)生產(chǎn)的數(shù)據(jù)量超過(guò)了之前整個(gè)人類(lèi)歷史創(chuàng)造的數(shù)據(jù)總和。要為如此大規(guī)模的數(shù)據(jù)提供安適保障,專(zhuān)家們不得不重新思考,該以何種方式?jīng)Q定敏感文件的授權(quán)與撤銷(xiāo);更加重要的是,該如何識(shí)別和追蹤不成制止的異常拜候,并排查出哪些是真正具有危險(xiǎn)的行為。
對(duì)于數(shù)據(jù)安適而言,最為關(guān)鍵的問(wèn)題就是:“這個(gè)行為正常嗎?如果不正常,那么它是被允許的嗎?”Imperva的機(jī)器學(xué)習(xí)創(chuàng)新技術(shù)可以為這一問(wèn)題提供答案。機(jī)器學(xué)習(xí)把模式識(shí)別算法應(yīng)用在每一位用戶的每一次SQL查詢上,,把內(nèi)部威脅扼殺在搖籃之中。
數(shù)據(jù)安適中的機(jī)器學(xué)習(xí)
機(jī)器學(xué)習(xí)作為一種人工智能,可以讓計(jì)算機(jī)檢測(cè)出各種模式,并使用通過(guò)訓(xùn)練或不雅觀察而習(xí)得的算法來(lái)建立行為基線。機(jī)器學(xué)習(xí)可以大規(guī)模地處理和分析人力難以駕馭的大量數(shù)據(jù),而提供人類(lèi)可以理解的分析結(jié)果。
傳統(tǒng)的安適控制通?;谧钚“莺蛱貦?quán)模型。這個(gè)模型在理論上是成立的,但是在實(shí)踐中卻很難得到大規(guī)模的實(shí)現(xiàn)。要想以人工的方式?jīng)Q定每個(gè)用戶對(duì)每種數(shù)據(jù)具體的拜候權(quán),自己就足夠令人望而卻步了。而在此基礎(chǔ)之上,還要從拜候日志中篩選并識(shí)別出潛在的不良行為,這就更難以實(shí)現(xiàn)了。即使是在一個(gè)只有 50 到 200 個(gè)數(shù)據(jù)庫(kù)的小企業(yè)環(huán)境中,這個(gè)過(guò)程也會(huì)讓 20 人規(guī)模的IT部門(mén)難以招架。而在更大的企業(yè)中,數(shù)據(jù)庫(kù)的數(shù)量很可能達(dá)到 1 萬(wàn)以上。
好消息是,機(jī)器學(xué)習(xí)有望減輕這份負(fù)擔(dān)。對(duì)機(jī)器學(xué)習(xí)而言,更多的信息意味著更多的學(xué)習(xí)燃料。系統(tǒng)學(xué)習(xí)更多的輸入,就能通過(guò)學(xué)習(xí)給出更高質(zhì)量的結(jié)果。
話雖如此,機(jī)器學(xué)習(xí)的有效應(yīng)用依然要求人類(lèi)大腦的參與,需要透徹理解他們想要解決的問(wèn)題并可以把恰當(dāng)?shù)乃惴☉?yīng)用在恰當(dāng)?shù)膯?wèn)題上。算法并不是萬(wàn)能鑰匙,而企業(yè)結(jié)構(gòu)也不都是一樣的。真正創(chuàng)新式的機(jī)器學(xué)習(xí)必需更進(jìn)一步。
上下文中的機(jī)器學(xué)習(xí)
簡(jiǎn)單的機(jī)器學(xué)習(xí)可以處理日志文件并解讀拜候行為模式;可是,僅僅按照何人在何時(shí)登錄何種資源來(lái)生成行為模型,是遠(yuǎn)遠(yuǎn)不夠的。在數(shù)據(jù)安適的問(wèn)題領(lǐng)域中,真正的需求是對(duì)潛在的惡意數(shù)據(jù)濫用提早一步的識(shí)別,這就需要機(jī)器學(xué)習(xí)更深地了解被拜候的具體數(shù)據(jù)。
機(jī)器學(xué)習(xí)可以把建立數(shù)據(jù)拜候模式基線的手動(dòng)進(jìn)程自動(dòng)化。使用模式識(shí)別,機(jī)器學(xué)習(xí)可以識(shí)別對(duì)等群組中個(gè)體的正常行為,還可以動(dòng)態(tài)地學(xué)習(xí)真正有效的對(duì)等群組,而開(kāi)脫對(duì)于靜態(tài)的“組織結(jié)構(gòu)圖”的依賴——后者極少能夠反映人們的真實(shí)工作狀態(tài)。
過(guò)去幾年,人工智能與機(jī)器學(xué)習(xí)在模式識(shí)別上取得了顯著的進(jìn)展。例如,F(xiàn)acebook的機(jī)器學(xué)習(xí)應(yīng)用,不但可以識(shí)別圖像中有什么,并且還能識(shí)別場(chǎng)景的上下文,以及其中是否包羅其它已知的實(shí)體或地標(biāo)。同理,Imperva設(shè)計(jì)師在數(shù)據(jù)集合上應(yīng)用了恰當(dāng)?shù)臋C(jī)器學(xué)習(xí)算法,創(chuàng)造了一個(gè)檢查對(duì)等群組分支使用模式的系統(tǒng)。這個(gè)技術(shù)已經(jīng)超出了識(shí)別登錄和拜候時(shí)長(zhǎng)的范疇,可以針對(duì)性地識(shí)別和建立正常的用戶數(shù)據(jù)拜候行為,可以輕松過(guò)濾出潛在的有危險(xiǎn)的行為,制止其損害企業(yè)數(shù)據(jù)。
對(duì)于安適團(tuán)隊(duì)而言,關(guān)鍵的問(wèn)題在于:在一次個(gè)人拜候中,發(fā)生了什么,行為是否良好?他們需要制作一份事件清單,以備適當(dāng)規(guī)模的SOC團(tuán)隊(duì)調(diào)查。出于實(shí)用性的考慮,得出的數(shù)據(jù)必需滿足三點(diǎn)要求:有限性,保證團(tuán)隊(duì)可以輕松地消化信息:精確性,排除噪音,提高信度;以及上下文的豐富性,讓調(diào)查無(wú)須從零開(kāi)始。
讓機(jī)器學(xué)習(xí)更聰明
Imperva開(kāi)發(fā)者通過(guò)把機(jī)器學(xué)習(xí)算法的豐富知識(shí)和關(guān)于構(gòu)成差別種類(lèi)用戶不當(dāng)數(shù)據(jù)拜候行為的特定專(zhuān)業(yè)知識(shí)相結(jié)合,達(dá)到了三個(gè)目標(biāo)。
利用模式識(shí)別算法處理數(shù)據(jù)安適信息,與Facebook圖像識(shí)別相似,只不過(guò)識(shí)另外對(duì)象換成了上下文中的數(shù)據(jù)拜候模式,包孕上萬(wàn)名員工的賬戶,以及每天上百億次的個(gè)人數(shù)據(jù)拜候?;谛袨榈娜航M自動(dòng)識(shí)別,可以精確定義每個(gè)用戶的拜候權(quán)限,并按照用戶與企業(yè)文件的交互變革進(jìn)行動(dòng)態(tài)調(diào)整。在對(duì)比試驗(yàn)中,Imperva應(yīng)用機(jī)器學(xué)習(xí)動(dòng)態(tài)對(duì)等群組分析算法,發(fā)現(xiàn)了大量其他方式無(wú)法注意到的問(wèn)題。
以往,大多數(shù)機(jī)器學(xué)習(xí)應(yīng)用都從很高的視角不雅觀測(cè)數(shù)據(jù)拜候,好比:王剛在星期二上午 8 點(diǎn) 12 分登入了一個(gè)特定的數(shù)據(jù)庫(kù),并在 8 點(diǎn) 39 分登出??墒撬鼈儫o(wú)法確定王剛在那 27 分鐘內(nèi)真正做了些什么,所以很難判定行為模式是否正常,是否存在潛在的數(shù)據(jù)濫用。
而Imperva機(jī)器學(xué)習(xí)在理解模式識(shí)別算法的基礎(chǔ)上,可以更加聰明地識(shí)別威脅數(shù)據(jù)的用戶行為模式。檢查每個(gè)用戶的每次SQL查詢,意味著機(jī)器學(xué)習(xí)不但可以識(shí)別王剛在何時(shí)登錄了多長(zhǎng)時(shí)間,并且更為重要的是,還可以學(xué)習(xí)到他拜候了什么。然后,我們可以參照他的對(duì)等群組,比較他的行為與其他人的行為,最終判定數(shù)據(jù)拜候到底是正常的,還是不正常的。
大規(guī)模、動(dòng)態(tài)化、結(jié)合上下文與專(zhuān)業(yè)知識(shí)的機(jī)器學(xué)習(xí),能夠提早適應(yīng)新興的威脅形態(tài),永遠(yuǎn)領(lǐng)先一步,提早預(yù)防數(shù)據(jù)違規(guī)。
標(biāo)簽:撫州 百色 漳州 巴中 襄陽(yáng) 漢中 昌都
巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《Imperva創(chuàng)新機(jī)器學(xué)習(xí):領(lǐng)先威脅一步》,本文關(guān)鍵詞 Imperva,創(chuàng)新,機(jī)器,學(xué)習(xí),領(lǐng)先,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。