不管人類是否樂(lè)意,人工智能的車輪已經(jīng)碾過(guò)來(lái)了。
智力游戲、國(guó)際象棋、圍棋、德州撲克……人類逐步淪陷,從去年AlphaGo和李世乭對(duì)決前大眾認(rèn)為人類必贏的呼聲,到如今圍棋第一人柯潔迎戰(zhàn)AlphaGo,卻面臨大眾“機(jī)器必贏”的預(yù)測(cè)。而在關(guān)于“人工智能會(huì)取代人類嗎?”的追問(wèn)里,人工智能已經(jīng)選擇了下一個(gè)對(duì)手。
5 月 27 日至 28 日,由機(jī)器之心主辦的 2017 全球機(jī)器智能峰會(huì)(GMIS)在北京舉行,不但云集LSTM 之父Jürgen
Schmidhuber等人工智能業(yè)內(nèi)大咖,分享主題演講,還設(shè)置了各類展覽。其中,搜狗汪仔機(jī)器人尤為引人注意。峰會(huì)期間,它不但在搜狗展位與不雅觀眾進(jìn)行了親密互動(dòng),還和人類頂尖速錄員進(jìn)行了一場(chǎng)“人機(jī)大戰(zhàn)”。
比擬之前大多圍繞基礎(chǔ)速記展開(kāi)的對(duì)戰(zhàn),這次的角逐難度飆升了數(shù)級(jí),普通文章、專業(yè)詞匯、方言口音、中英混合內(nèi)容、繞口令,五項(xiàng)角逐內(nèi)容,都是語(yǔ)音識(shí)別領(lǐng)域最難并吞的的技術(shù)點(diǎn)?;逎y懂的專業(yè)術(shù)語(yǔ),機(jī)器能懂嗎?帶有口音的港普機(jī)器能識(shí)別嗎?兩國(guó)語(yǔ)言混雜,機(jī)器又能反應(yīng)過(guò)來(lái)嗎?人類是在機(jī)器不擅長(zhǎng)的領(lǐng)域?qū)で蟊旧淼膬?yōu)勢(shì)。
隨著峰會(huì)現(xiàn)場(chǎng)音頻響起,大屏兩側(cè)實(shí)時(shí)出現(xiàn)了對(duì)戰(zhàn)雙方的轉(zhuǎn)錄文本。一邊是人類速錄員,正常打字速度,能到每分鐘 220 字以上,一邊是搜狗汪仔,背后語(yǔ)音識(shí)別技術(shù)加持,還能按照上下文意自動(dòng)調(diào)整轉(zhuǎn)化的內(nèi)容。
普通內(nèi)容的語(yǔ)音識(shí)別對(duì)于人機(jī)雙方都并不難,人類和機(jī)器均快速準(zhǔn)確地完成了速記任務(wù)。但從第二輪比拼開(kāi)始,人類和機(jī)器就同時(shí)面臨了艱巨的挑戰(zhàn),“解耦神經(jīng)接口”“誤差真值梯度”等難以理解的專業(yè)詞匯,說(shuō)話人的四川方言和港普口音,以及中文夾英文的說(shuō)話方式,讓速記難度飆升。中英混合的說(shuō)話方式,對(duì)于機(jī)器的影響顯然更大,最終機(jī)器以4: 1 戰(zhàn)勝人類速記。
賽后,搜狗CEO王小川總結(jié)說(shuō):“AlphaGo2. 0 在圍棋上戰(zhàn)勝人類,讓我們?yōu)榧夹g(shù)發(fā)展而喜悅。但當(dāng)我們回歸真實(shí)的使用場(chǎng)景,,就會(huì)發(fā)現(xiàn),今天的人工智能與我們抱負(fù)中還有差距,所以通過(guò)這次人機(jī)大戰(zhàn),我們會(huì)開(kāi)始思考,在人工智能技術(shù)前沿,我們還有什么地方是做不到的,以及未來(lái)還有哪些突破的標(biāo)的目的。”
實(shí)際上,這并非搜狗語(yǔ)音識(shí)別技術(shù)的首次公開(kāi)表態(tài)。早在 2016 年 7 月,極客公園奇點(diǎn)大會(huì)上,搜狗語(yǔ)音就在演講現(xiàn)場(chǎng)做了實(shí)時(shí)字幕上屏,演講者語(yǔ)畢,不雅觀眾就能直接獲得機(jī)器所做的速記稿。實(shí)際上更早之前,搜狗輸入法中就落地了語(yǔ)音輸入功能,語(yǔ)音輸入日頻次高達(dá)2. 4 億次,識(shí)別速度達(dá)每分鐘 400 字。
除大戰(zhàn)之外,搜狗也應(yīng)邀為此次大會(huì)提供了機(jī)器同傳辦事,當(dāng)嘉賓進(jìn)行演講時(shí),通過(guò)語(yǔ)音識(shí)別技術(shù),機(jī)器將演講者的語(yǔ)音轉(zhuǎn)化為文字,同時(shí),搜狗機(jī)器同傳對(duì)內(nèi)容進(jìn)行翻譯,投射在屏幕上。通過(guò)此項(xiàng)技術(shù),即使不使用同傳設(shè)備,中外嘉賓也能夠無(wú)障礙理解嘉賓的演講內(nèi)容。
AlphaGo2. 0 引發(fā)的人機(jī)大戰(zhàn)在圍棋領(lǐng)域,然而我們更多的只是作為“吃瓜群眾”感受到人工智能的威力,對(duì)它的應(yīng)用場(chǎng)景卻感知甚微。而汪仔引發(fā)的人機(jī)大戰(zhàn),背后則展示了搜狗在如今大火的語(yǔ)音識(shí)別領(lǐng)域的突破性成就。結(jié)合搜狗輸入法這款國(guó)民級(jí)產(chǎn)品,搜狗不但實(shí)現(xiàn)了語(yǔ)音識(shí)別技術(shù)的落地與靈活使用,更在醞釀著人機(jī)交互方式的全新厘革。