在騰訊視頻舉辦的電視劇評(píng)價(jià)新維度媒體沙龍上,騰訊視頻總編輯王娟,騰訊網(wǎng)絡(luò)媒體事業(yè)群視頻產(chǎn)品技術(shù)部副總經(jīng)理何毅進(jìn)對(duì)網(wǎng)絡(luò)播放量的相關(guān)問題做了詳細(xì)回答。
何毅進(jìn)解釋了四個(gè)容易混淆的概念:播放量VV、UV、正片播放量、專輯播放量。
關(guān)于播放量VV,一個(gè)非常簡(jiǎn)單的原則是用戶點(diǎn)擊產(chǎn)生的播放,或者是頁面自動(dòng)的播放,即為一個(gè)拜訪量。“比如當(dāng)你點(diǎn)開了騰訊網(wǎng),或者任何一個(gè)網(wǎng)站,這個(gè)網(wǎng)站有一個(gè)視頻,無論是自動(dòng)播,還是用戶點(diǎn)擊按紐開始播,無論在手機(jī)端,PC端,還是電視端,只要開始播了,就算一個(gè)播放量,我們也叫VV。”何毅進(jìn)說。
專輯播放量的概念相對(duì)復(fù)雜。“有報(bào)道說開播前某劇已經(jīng)把一億的播放量納入囊中?這個(gè)說法合理不合理?”專輯播放量的概念可以解釋這個(gè)問題:通常來說視頻網(wǎng)站會(huì)為片子(電視劇、電影等)建一個(gè)專輯。在正片上映之前,該片的預(yù)告、花絮、片花等產(chǎn)生的播放量都會(huì)計(jì)入到專輯播放量中。也就是說,的確存在劇目未播但專輯播放量已經(jīng)很高的情況。
正片播放量,指的是正劇本身的播放量。何毅進(jìn)提醒:“如果你看到正片播放量比專輯播放量大,那肯定是寫錯(cuò)了,或者是數(shù)據(jù)有問題。”
第四個(gè)概念UV容易和VV混淆。UV是獨(dú)立訪客的訪問量。簡(jiǎn)單來說,一臺(tái)設(shè)備,有一個(gè)用戶訪問了,就是一個(gè)UV。何毅進(jìn)進(jìn)一步做出解釋:“您拿起手機(jī),點(diǎn)開了騰訊視頻,播放了,就是一個(gè)UV。同一臺(tái)手機(jī),再去訪問愛奇藝,對(duì)愛奇藝也是一個(gè)UV。這個(gè)手機(jī)用瀏覽器訪問一次騰訊視頻,再用騰訊視頻APP訪問UV視頻,這個(gè)UV會(huì)怎么算?同一臺(tái)手機(jī),無論哪種訪問方法,它是一個(gè)UV。”
同一個(gè)IP下多個(gè)設(shè)備的訪問UV怎么統(tǒng)計(jì)?現(xiàn)在業(yè)界并沒有完全解決這個(gè)問題的標(biāo)準(zhǔn)。對(duì)于視頻網(wǎng)站來說,他們有時(shí)候無法知道IP跟設(shè)備是怎么對(duì)應(yīng)的,有時(shí)候沒有辦法取得傳統(tǒng)的設(shè)備號(hào)。“當(dāng)我們坐在這個(gè)廳里,有幾位朋友拿的是筆記本電腦,你去訪問騰訊視頻網(wǎng)站的時(shí)候,算是一個(gè)UV還是幾個(gè)UV?共有十個(gè)人都有筆記本電腦,算十個(gè)UV,這是有誤差的。我們有大量的網(wǎng)絡(luò)是在一個(gè)IP號(hào)段背后,比如說這個(gè)出口就是一個(gè)總的IP,這個(gè)IP背后發(fā)生了十個(gè)訪問,這個(gè)時(shí)候業(yè)內(nèi)的通用做法是會(huì)根據(jù)一個(gè)經(jīng)驗(yàn)值再把它濃縮一下,比如說一個(gè)IP后面對(duì)應(yīng)最多可能是三個(gè)UV,這個(gè)時(shí)候UV的統(tǒng)計(jì)是偏保守的。
何毅進(jìn)告訴騰訊科技,我們可以通過常識(shí)來推斷數(shù)據(jù)的真假。“比如 200 億專輯播放量。如果這個(gè)片子是一部 80 集的電視劇, 200 除以80,每一集要被觀看2. 5 億次,平攤到片花和正劇里面,每個(gè)正片要達(dá)到 8 千萬到 1 億次的播放量,而 100 億的播放量是片花和花絮,如果你的視頻平臺(tái)有 8 千萬的人觀看電視劇,這是有可能的。”他說:“再比如日播放量是 15 個(gè)億,也是要用常識(shí)來推斷。首先看這個(gè)視頻平臺(tái)總的用戶數(shù)是多少,你除一下,你看看這個(gè)數(shù)據(jù)是不是符合它的水位?”
王娟補(bǔ)充道:“前段時(shí)間在播《三生三世》,有過一篇稿子說一天播 80 億。大家質(zhì)疑這個(gè)數(shù)據(jù)到底水分有多大?我想有兩個(gè)基本的元素,一個(gè)是很多的媒體從業(yè)人員不是視頻的從業(yè)人員,容易把VV當(dāng)成UV,比如說今天一部劇有兩個(gè)億的播放量,他會(huì)覺得中國(guó)才有多少億人,感覺有兩億人在觀看這部劇,這是認(rèn)知上的誤區(qū)。實(shí)際上有可能這兩億播放量是由兩千萬人帶來的。一個(gè)人今天播了兩集,把兩集看了,就是兩個(gè)VV,如果她對(duì)《三生三世》特別喜歡,又看了趙又霆和楊冪的各種短視頻,那么加起來她一個(gè)人貢獻(xiàn)的VV有 10 個(gè)之多,乘一下,其實(shí)播放量在2-2. 5 億是一個(gè)正常的水位,這個(gè)不代表這部劇就影響了兩億人。這是一個(gè)專集的VV,背后不可能跟人數(shù)來劃等號(hào),其實(shí)是一個(gè)點(diǎn)擊后的統(tǒng)計(jì)行為。”
對(duì)于刷量問題,何毅進(jìn)透露了技術(shù)層面處理刷量的辦法。
“其實(shí)技術(shù)上也可以按常識(shí)來判斷,但是這個(gè)常識(shí)的背后我們是有大數(shù)據(jù)和深度學(xué)習(xí)的方式來支持的。”
何毅進(jìn)舉例:一般來說,從一個(gè)號(hào)段背后,如果產(chǎn)生了大量的播放量,這個(gè)號(hào)段是屬于什么情況?如果這個(gè)號(hào)段這一年常規(guī)性的都有這么高的播放量,可能是比較正常的,但如果這個(gè)號(hào)段在今年三月份之前播放很低,三月份突然有幾天播放量很高,這是有刷量嫌疑,這種用戶類型會(huì)被我們的模型刷出來的。
另外,一秒鐘內(nèi)點(diǎn)了就走,這是非常像機(jī)器行為的刷量,不是正常人的行為。你看一個(gè)東西不感興趣,會(huì)兩三秒鐘退出,也有可能看到十秒,或者五秒之后才退出。通過這種播放行為,就可以看到哪些播放量是疑似刷量。
事實(shí)上,騰訊視頻會(huì)有很多方式去防刷量。何毅進(jìn)告訴騰訊科技:”防刷量是一個(gè)長(zhǎng)期的攻防過程,會(huì)有很多的刷量機(jī)構(gòu),或者粉絲和熱情的用戶。他們會(huì)識(shí)別視頻網(wǎng)站用什么模型來認(rèn)定刷量的流量,他去學(xué)習(xí),會(huì)暫時(shí)攻破刷量模型。然后我們就會(huì)升級(jí),我們看到這個(gè)不太正常,這部劇不是很火的,為什么突然有一億的播放量,我們會(huì)自己警醒,開始去做非??焖俚哪P透膭?dòng),一改就發(fā)現(xiàn)我們又看到新的刷量機(jī)制,這是一個(gè)長(zhǎng)期的過程。在長(zhǎng)期的攻防過程里面,我們不希望播放量是不健康的。所以對(duì)于我們來說。抵制刷量是非常堅(jiān)決的,要長(zhǎng)期投入。”