2015年的“雙11”是個關(guān)鍵節(jié)點。2015 年之前的“雙11”,商品推薦都是人來控制的,由運(yùn)營決定給用戶推薦什么產(chǎn)品。而2015年那次“雙11”,是阿里第一次基于算法和大數(shù)據(jù),為用戶做大規(guī)模的、個性化的商品推薦系統(tǒng),叫做“千人千面”,是阿里流量分發(fā)模式很大的升級和轉(zhuǎn)型。
2015年的“雙11”結(jié)束后,淘寶的設(shè)計、工程和算法團(tuán)隊聚在一起,商量下一年要做些什么。他們當(dāng)時想,目前已經(jīng)做到的個性化推薦,都是基于白底圖商品推薦,能不能往前邁一步,讓強(qiáng)營銷導(dǎo)向的廣告資源位的設(shè)計也“千人千面”呢?
從純商品個性化跨到廣告資源位個性化,中間幾個關(guān)鍵的技術(shù)點打通之后,他們就在內(nèi)部發(fā)起了一個人工智能設(shè)計的項目,主要開發(fā)的產(chǎn)品就是“魯班”。之所以叫“魯班”,也是因為一句玩笑話。當(dāng)時說要 “讓天下沒有難擼的banner ”,諧音就是“魯班”,后來發(fā)現(xiàn)簡直太合適了,魯班不僅本身是個偉大的工匠,也是很多工具的發(fā)明人,所以他的理念跟當(dāng)時的“魯班”團(tuán)隊做的事情是不謀而合的,他們也希望發(fā)明工具,讓設(shè)計師更好地工作。
隨著產(chǎn)品和團(tuán)隊逐漸壯大,現(xiàn)在團(tuán)隊已經(jīng)演進(jìn)為“阿里智能設(shè)計實驗室”。第一點是圖像算法“摳圖”。因為高質(zhì)量的廣告設(shè)計需要把商品圖片摳出來,放到精美的設(shè)計主題里。以前都是設(shè)計師給商品摳圖后再做設(shè)計,現(xiàn)在阿里智能設(shè)計實驗室要用機(jī)器做海量設(shè)計,就得讓機(jī)器來做這個事情。他們跟阿里搜索部門做圖像切割的算法團(tuán)隊合作,處理海量的商品自動摳圖。
第二點是把設(shè)計變成“數(shù)據(jù)”。一張廣告設(shè)計圖片是像素組成的“信息”,不是“數(shù)據(jù)”。利用機(jī)器把商品、文字和設(shè)計主題進(jìn)行在線合成,這樣每張廣告圖片就帶上了商品信息,可以根據(jù)消費(fèi)者偏好進(jìn)行個性化投放。所以“魯班”產(chǎn)品上線初期,他們請設(shè)計師根據(jù)活動主題做了大批量風(fēng)格確定的模板,證明了這種模式投放效果可以大幅提升點擊率。
第三點就是讓機(jī)器學(xué)習(xí)設(shè)計??俊叭巳庠O(shè)計模板”度過了第一個階段,但長遠(yuǎn)發(fā)展角度必須讓機(jī)器來做設(shè)計。大概是 16 年 8 月份開始的,有一位之前負(fù)責(zé)淘寶“拍立淘”(在淘寶內(nèi)通過圖片搜索找同款,隨拍隨找)產(chǎn)品開發(fā)的圖像算法專家加入了進(jìn)來,主導(dǎo)整個智能設(shè)計的算法框架。第一個挑戰(zhàn)是解決數(shù)據(jù)問題。因為行業(yè)里沒有什么參考對象,只能不斷試錯。剛開始的時候,數(shù)據(jù)不太夠,團(tuán)隊就制定了很強(qiáng)的設(shè)計規(guī)則去控制,結(jié)果要么就是機(jī)器跑不出設(shè)計結(jié)果,要么就是設(shè)計出來的結(jié)果很失控。設(shè)計是有無窮可能性的,靠弱數(shù)據(jù)強(qiáng)規(guī)則必然走不通。意識到這一點以后,他們就集中精力去解決數(shù)據(jù)問題,把內(nèi)部設(shè)計師電腦里的設(shè)計圖和供應(yīng)商的設(shè)計圖都收集過來。
他們有自己開發(fā)的設(shè)計協(xié)同工具“設(shè)計板”,有點類似Slack,但是是專門用于設(shè)計協(xié)同的。這樣才能方便大批量、規(guī)?;恼业竭@些數(shù)據(jù)。
第二個挑戰(zhàn)是數(shù)據(jù)清洗和輸入機(jī)器。因為收集過來的數(shù)據(jù)是很雜亂的。比如“雙11”期間“魔性”的設(shè)計風(fēng)格跟無印良品這種“性冷淡”風(fēng)格差異很大系統(tǒng),這是完全不一樣的品牌調(diào)性和設(shè)計需求。團(tuán)隊花了很大的力氣去整理和建立了一套數(shù)據(jù)體系去管理設(shè)計數(shù)據(jù),讓機(jī)器生產(chǎn)出更匹配的結(jié)果?,F(xiàn)在講 AI ,外界很難感受到機(jī)器的智能含量多高、體現(xiàn)在什么地方,但樂乘也不太同意“魯班”是“大數(shù)據(jù)生產(chǎn)”這種說法。這個疑問涉及兩個核心的,也是最基本的問題:一是什么叫設(shè)計智能,二是怎么評價機(jī)器是否具備了設(shè)計智能。
AI 目前有幾個主要方向,一個是“識別”,像語音識別、圖像識別;另一個是“生成”,也就是阿里智能實驗室在做的,從無到有創(chuàng)造東西,讓機(jī)器能根據(jù)請求生成符合特定要求的結(jié)果。他們把這一智能設(shè)計定位為:可控的圖像生成技術(shù)??梢越Y(jié)合技術(shù)框架和原理來理解,簡單來說,在整個生成過程中,有4個核心步驟(具體的講解可以參考
@剝桔子
分享的 UCAN 2017回顧):
第一步,讓機(jī)器理解設(shè)計是什么構(gòu)成的:通過人工數(shù)據(jù)標(biāo)注,對設(shè)計的原始文件中的圖層做分類,對元素做標(biāo)注。設(shè)計專家團(tuán)隊也會提煉設(shè)計手法和風(fēng)格。通過數(shù)據(jù)的方式告訴機(jī)器這些元素為什么可以放在一起,把專家的經(jīng)驗和知識通過數(shù)據(jù)輸入。這部分核心是深度序列學(xué)習(xí)的算法模型。
第二步,建立元素中心:當(dāng)機(jī)器學(xué)習(xí)到設(shè)計框架后,需要大量的生產(chǎn)資料。阿里智能設(shè)計實驗室會建立元素庫,通過機(jī)器做圖像特征提取,然后分類,再通過人工控制圖像質(zhì)量以及版權(quán)問題(實驗室購買了有版權(quán)的圖庫,也是希望從一開始就避免版權(quán)方面的糾紛)。
第三步,生成的電銷外呼程序:原理有點像 Alpha Go 下圍棋。在設(shè)計框架上構(gòu)建起虛擬畫布,類似棋盤,生成的電銷外呼程序把元素中心的元素往棋盤放,在這里實驗室采用了“強(qiáng)化學(xué)習(xí)”,就好像你在家里放一臺掃地機(jī)器人,讓它自己跑,跑個幾圈,它自己會知道哪里有障礙要避開。在強(qiáng)化學(xué)習(xí)的過程中,機(jī)器參考原始樣本,通過不斷嘗試,得到一些反饋,然后從中學(xué)習(xí)到什么樣的設(shè)計是對的、好的。
第四步,評估的電銷外呼程序:實驗室會抓取大量設(shè)計的成品,從“美學(xué)”和“商業(yè)”兩個方面進(jìn)行評估。美學(xué)上的評估由人來進(jìn)行,這方面有專業(yè)眾包公司;商業(yè)上的評估就是看投放出去的點擊率瀏覽量等等。2016年“雙11”魯班設(shè)計了1.7億個banner。
其實這 1.7 億個 banner 是有設(shè)計強(qiáng)干預(yù)的,因為“雙11”的風(fēng)格是比較確定而且需要嚴(yán)格執(zhí)行,所以設(shè)計師制作了很多“雙11”特定風(fēng)格的固定模板。機(jī)器在這個基礎(chǔ)上,把調(diào)整尺寸這些行為進(jìn)行優(yōu)化,節(jié)省了尺寸拓版的人力。用機(jī)器生成億級設(shè)計從而帶來商業(yè)效果提升,總體來說也是一次非常成功的應(yīng)用實踐。
未來的“雙11”應(yīng)該仍然會是設(shè)計師帶著機(jī)器做設(shè)計的模式,重大活動中設(shè)計機(jī)器是提升效率的助理角色。引用阿里 CEO 的話——“魯班是數(shù)據(jù)業(yè)務(wù)化的代表”,之前阿里有很多數(shù)據(jù),但都是閑置的或者利用效率不高的,比如海量的商品圖,而“魯班”把數(shù)據(jù)變成了業(yè)務(wù),通過大規(guī)模設(shè)計加精準(zhǔn)投放,提高每個廣告位的資源效率,帶動了流量的效率和業(yè)務(wù)價值,點擊率是翻倍的,收益也接近翻倍。人員倒沒有出現(xiàn)縮減,只是做的事情有調(diào)整了,要學(xué)習(xí)這套電銷外呼程序,學(xué)習(xí)如何訓(xùn)練機(jī)器,同時在美學(xué)方面做把控。