作為新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動力——人工智能,已連續(xù)三年被寫進(jìn)政府工作報告中,“關(guān)鍵核心技術(shù)”更是近年來首次出現(xiàn)在政府工作報告中,而自然語言理解技術(shù)就是支撐人工智能得到廣泛應(yīng)用的關(guān)鍵核心技術(shù)。
過去十年自然語言理解技術(shù)已有了重大突破,在語音識別和機(jī)器翻譯等領(lǐng)域都取得了長足發(fā)展,但在實(shí)際應(yīng)用中還存在很多不足,譬如大部分“智能客服”還基本處于“智障客服”階段。因此需要繼續(xù)加強(qiáng)對自然語言理解技術(shù)的投入,從而讓人工智能從感知智能跳躍到認(rèn)知智能。
認(rèn)知智能市場大有可為 NLP開放平臺應(yīng)運(yùn)而生
從技術(shù)到產(chǎn)品,從產(chǎn)業(yè)端到市場化,NLP落地應(yīng)用的探索長期以來面臨著幾座大山。一是NLP技術(shù)的“知名度”不足,許多人不知道該技術(shù)怎么用以及如何獲取;二是學(xué)術(shù)研究與產(chǎn)業(yè)脫節(jié)的問題,掌握NLP最前沿技術(shù)的人幾乎都在高校中,而最需要使用這項(xiàng)技術(shù)的人還在市場中苦苦尋覓;三是針對各個行業(yè)的語料庫數(shù)據(jù)不足,導(dǎo)致落地時無法順利推進(jìn)。
在當(dāng)前NLP產(chǎn)學(xué)研用仍處于被動掣肘的大環(huán)境下,中國人工智能市場的發(fā)展規(guī)模又是怎樣一番景象呢?我們來看一組數(shù)據(jù):
聚焦NLP市場:放眼全球,whatech預(yù)測2020年全球NLP市場規(guī)模將近134億美元,而隨著中國NLP市場的逐年擴(kuò)大,保守估計到2020年,中國NLP市場至少占全球900億人民幣的10%,約90億人民幣,并將帶動1000億相關(guān)市場的發(fā)展。此時,正處于少年期的NLP將一展身手,大有可為。
NLP被稱為人工智能“皇冠上的明珠”,也是人工智能領(lǐng)域最難突破的部分。中國聲谷運(yùn)營單位總裁祁東風(fēng)表示,“作為全國首個定位于人工智能領(lǐng)域的國家級產(chǎn)業(yè)基地——中國聲谷通過自然語言理解技術(shù)的市場應(yīng)用倒逼基礎(chǔ)理論和關(guān)鍵技術(shù)創(chuàng)新,走出了一條獨(dú)特且可持續(xù)的發(fā)展路徑,與神州泰岳、國家中文信息學(xué)會聯(lián)合打造了國內(nèi)首個‘NLP開放平臺——中文信息(深度)處理開放創(chuàng)新平臺’,將NLP核心技術(shù)應(yīng)用向各行業(yè)各領(lǐng)域縱深推進(jìn)。”
NLP開放平臺精耕細(xì)作 將實(shí)現(xiàn)多場景應(yīng)用落地
針對NLP的中文歧義性難題,NLP開放平臺擁有獨(dú)創(chuàng)的“本體建模技術(shù)”,把與場景相關(guān)的領(lǐng)域知識、NLP任務(wù)、語言資源等內(nèi)容進(jìn)行形式化規(guī)范描述,使得NLP場景應(yīng)用實(shí)現(xiàn)最大化的共享;如何處理語言結(jié)構(gòu)的另一難題,平臺又將符號化語義與深度學(xué)習(xí)技術(shù)結(jié)合,即能有效地識別多種語言結(jié)構(gòu),實(shí)現(xiàn)同一意思、不同結(jié)構(gòu)的歸一化處理。據(jù)了解,擁有自主知識產(chǎn)權(quán)的智慧語義認(rèn)知技術(shù)對語言結(jié)構(gòu)的遞歸嵌套處理也表現(xiàn)優(yōu)異,目前該平臺已經(jīng)具備可以識別出3層以上語言結(jié)構(gòu)遞歸嵌套的技術(shù),極大增強(qiáng)了NLP的可解釋性。
“NLP縱深行業(yè)應(yīng)用,需要盯準(zhǔn)需求,貼合業(yè)務(wù),直擊行業(yè)痛點(diǎn),才能打開市場,獨(dú)占鰲頭。”近日,中國聲谷入園企業(yè)—神州泰岳副總裁李國東在以“見智見未來”為主題的2019全球人工智能產(chǎn)品應(yīng)用博覽會上介紹,神州泰岳在人工智能語義技術(shù)擁有10余年的技術(shù)研發(fā)優(yōu)勢,更是中國中文信息學(xué)會唯一指定的產(chǎn)學(xué)研合作單位,2018年依托中國聲谷的“政策紅利”和自身在NLP技術(shù)上的前沿科技對NLP開放平臺進(jìn)行全面的資源整合、精耕細(xì)作,已在多領(lǐng)域推動NLP技術(shù)賦能行業(yè)應(yīng)用。
公安行業(yè)首當(dāng)其沖,去年神州泰岳推出了一款面向公安行業(yè)的綜合應(yīng)用產(chǎn)品——“智腦2.0”,以人工智能-自然語言處理(AI-NLP)為核心,以極速計算、實(shí)體360°全息畫像、數(shù)據(jù)共享為支撐的跨警種跨網(wǎng)域的產(chǎn)品,適用于公安全警種。最重要的是,“智腦2.0”獨(dú)有的公安筆錄文本分析功能,能通過感知智能技術(shù)和語義智能識別,對所有警員的有效研判動作進(jìn)行記憶存儲及分析,把海量的公安筆錄全部閱讀記錄,并且進(jìn)行提煉、歸納,將零碎的信息關(guān)聯(lián)起來,為將來一鍵破案做足夠積累。
公安只是NLP技術(shù)落地的其中一個場景,只要有語言、有文本的地方,都能用上NLP技術(shù)。增值境外服務(wù)——智慧旅游小漫、知識產(chǎn)權(quán)及專利審查及服務(wù)、法務(wù)及合同審查服務(wù)、智慧招聘、中醫(yī)古籍知識挖掘服務(wù)、新聞(簡訊)寫作、會議通知、調(diào)研報告自動寫作等等。NLP平臺已開放的服務(wù)涵蓋16個行業(yè)領(lǐng)域、140多個場景和200多個服務(wù),未來將真正實(shí)現(xiàn)讓NLP技術(shù)賦能應(yīng)用開發(fā)。
神州泰岳中國聲谷
神州泰岳是中國聲谷引入的智能語義領(lǐng)域龍頭企業(yè),于2017年正式入園。神州泰岳在人工智能語義技術(shù)擁有10余年的技術(shù)研發(fā)優(yōu)勢,更是中國中文信息學(xué)會唯一指定的產(chǎn)學(xué)研合作單位。2018年,中國聲谷攜手神州泰岳在推進(jìn)發(fā)展智能語義應(yīng)用與生態(tài)系統(tǒng)建設(shè)新聞發(fā)布會上,正式發(fā)布NLP開放創(chuàng)新平臺。早前,權(quán)威媒體《互聯(lián)網(wǎng)周刊》聯(lián)合eNet研究院發(fā)布了“2018年度人工智能企業(yè)TOP100”,榜單中收錄了中國互聯(lián)網(wǎng)、人工智能、生物識別、大數(shù)據(jù)、基因健康等多領(lǐng)域的知名企業(yè),神州泰岳作為NLP引領(lǐng)者榮列人工智能企業(yè)百強(qiáng)榜單,并位列TOP18.