本期局內(nèi)人:桑文鋒(神策數(shù)據(jù)創(chuàng)始人&CEO)
一:大數(shù)據(jù)領域的新機會
大數(shù)據(jù)這個領域,已經(jīng)有谷歌分析、百度統(tǒng)計這些做得比較好的產(chǎn)品了,但是我們還是做了神策,歸根到底是需求。有新的需求冒出來的時候,就會形成新的機會。
我把 2000 年的之后的互聯(lián)網(wǎng)分層 3 個階段:
第一階段:2000- 2006 年,流量時代。不管是三大門戶還是其他網(wǎng)站,歸根到底都是流量性質。阿誰時候你的產(chǎn)品流量大,你就牛。
第二階段:2006- 2011 年,用戶時代。這個階段大家更關注的是用戶數(shù),像國內(nèi)的開心、人人,國外的Facebook。對比產(chǎn)品的時候,更會偏向用戶活躍度,而不像最開始的時候以pv來衡量。
第三階段: 2012 年至今,,甚至到未來五年八年,我們進入了訂單時代。從 2012 年擺布的團購、到 2014 年擺布的O2O、再到去年的直播、互聯(lián)網(wǎng)金融的發(fā)展,我們看到一種趨勢,就是線下的交易在往線上搬。
發(fā)展到這個階段,我們做用戶分析的深度就紛歧樣了。從最開始的一個數(shù)據(jù)統(tǒng)計、分析用戶、到訂單交易、用數(shù)據(jù)漏斗做來源分析。這個時候你就會關心用戶留存,希望用戶下單、長久消費。所以你對信息的分析深度就紛歧樣。這就是需求的變革,需要更精細化的、更深度的用戶行為分析。
二:用戶行為數(shù)據(jù)在企業(yè)中有什么價值?
一個價值是用行為數(shù)據(jù)驅動決策。具體有三點:
1.產(chǎn)品改進。我們可以按照用戶行為數(shù)據(jù)分析出用戶的愛好,進一步改進產(chǎn)品。這個按鈕是放在左角還是右角,整個流程設計,怎么感官效果更好。
2.運營監(jiān)控。我們做了一些運營活動,效果怎么樣?這時候就需要進行運營監(jiān)控的數(shù)據(jù)分析。
3.商業(yè)決策。對辦理者來說,按照整體的運營分析數(shù)據(jù),我們就能決定下一步該怎么走。
其實這是我們傳統(tǒng)的BI(商務智能),只發(fā)揮了數(shù)據(jù)價值的20%,數(shù)據(jù)更大的價值是驅動產(chǎn)品智能。好比現(xiàn)在最火的AI,其實邏輯有三步。第一步有了數(shù)據(jù)基礎;第二步在這個數(shù)據(jù)基礎上抄上必然的策略算法;第三步把這個策略算法和這個數(shù)值再回歸到產(chǎn)品里面去,這樣就形成了一個循環(huán)。對這個產(chǎn)品自己就是一個的學習過程,這就是智能。
最簡單的例子是有兩個產(chǎn)品,一個是百度搜索。按照用戶的點擊的情況,它會決定哪些結果往前排,哪些結果往后排,這個就是用戶行為引入到搜索引擎里面去。
那別的一個產(chǎn)品就是今日頭條,今日頭條是一個以替代引擎為核心的媒體渠道,它能按照用戶接觸的各種新聞,決定進一步給你推送什么類型的。
總結來說,用戶行為數(shù)據(jù)在企業(yè)里起到的作用,一方面是驅動決策,另一方面是驅動產(chǎn)品智能。
三:數(shù)據(jù)分析的四個環(huán)節(jié)
▎數(shù)據(jù)采集
第一個環(huán)節(jié)是數(shù)據(jù)采集,就是數(shù)據(jù)從哪里來。在搭建百度大數(shù)據(jù)系統(tǒng)的過程中,我有一個很重要的心得:數(shù)據(jù)要做好,最重要的就是數(shù)據(jù)源。
從源頭上來說,我把大數(shù)據(jù)分解為四個字:大,全,細,時。
大,并不是物理上的大, 98 年谷歌最開始做搜索引擎的時候,它抓取了整個網(wǎng)站的網(wǎng)頁信息,一共 2500 萬個網(wǎng)頁才47GB,一個U盤就能裝下,但它必定是大數(shù)據(jù),因為它把整個網(wǎng)絡全都放進去了。
全,以美國選舉為例,網(wǎng)上的調研都說希拉里會獲勝,但結果特郎普獲勝了。后來分析原因說,美國中部的農(nóng)民都是不上網(wǎng)的。這就印證了一個問題,就是我們收集數(shù)據(jù)的時候,不能只收集客戶端的數(shù)據(jù),辦事端的數(shù)據(jù)也要收集的。
細,其實就是強調多維度。維度越多,占的數(shù)字規(guī)模不見得多,但是可能的組合形式就越多,你就會發(fā)現(xiàn)一些紛歧樣規(guī)律。
時,就是時效性。以前我們?nèi)丝谄詹槭敲?5 年做一次,準備一年、做一年、一年之后出結果。但現(xiàn)在上今日頭條上看新聞,你剛看完這條新聞,數(shù)據(jù)系統(tǒng)馬上就會記住你的優(yōu)先選擇,決定接下來給你保舉的內(nèi)容。
▎數(shù)據(jù)建模
所謂建模,就是把數(shù)據(jù)進行儲存,把它整理得更便利以后使用。就像是一個倉庫,如果運來的東西不去分類,而是隨便往那一堆,等以后要用的時候,找起來就麻煩了。
▎數(shù)據(jù)分析
漏斗分析、用戶留存分析、多維交叉分析、用戶點擊分析,這些都是在數(shù)據(jù)模型基礎上的應用。
▎數(shù)據(jù)指標