中國智能自動化大會(CIAC)是由中國自動化學(xué)會智能自動化專業(yè)委員會發(fā)起的系列學(xué)術(shù)會議,每一年或兩年舉辦一次,至今已成功舉辦13屆。CIAC-2019旨在為國內(nèi)外智能自動化領(lǐng)域的研究者提供一個面對面的交流平臺。CIAC-2019邀請了來自高等院校、科研院所和產(chǎn)業(yè)部門的專家匯聚一堂,深入交流前沿學(xué)術(shù)思想,積極探討技術(shù)與產(chǎn)業(yè)的發(fā)展趨勢。
本篇獲獎?wù)撐挠尚機(jī)器人與北京郵電大學(xué)聯(lián)合發(fā)表,聚焦基于增強(qiáng)突發(fā)詞檢測的突發(fā)事件檢測方法(Discovering Bursty Events based on Enhanced Bursty Term Detection,Burst_NBT)。
以微博為例,微博作為一種實時交互的社交媒體,能夠提供給用戶作為社交平臺來發(fā)表內(nèi)容、交換信息。許多真實的事件都是被微博首先揭露,然后再被傳統(tǒng)主流媒體報道,例如滴滴順風(fēng)車事件、2018年重慶公交車墜江事件。因此,基于微博的突發(fā)事件檢測已經(jīng)成為了一個研究熱點(diǎn)。
如何從微博中發(fā)現(xiàn)重要的突發(fā)事件目前還存在著挑戰(zhàn)。因為微博內(nèi)容簡短多變、五花八門,充滿了各種類型的話題。例如對日常天氣的描述、個人心情的表達(dá)等。我們?nèi)绾螐奈⒉┎┪闹型诰蛑匾耐话l(fā)事件,過濾掉不重要信息,并且區(qū)分屬于同一主題的不同事件?
目前業(yè)內(nèi)針對短文本話題檢測已有一些方法。例如BTM直接對詞的共現(xiàn)模式進(jìn)行建模、BBTM在BTM的基礎(chǔ)上將詞對的突發(fā)性作為先驗知識用于突發(fā)主題建模、Burst_ST抽取事件突發(fā)期間的hashtag,將提取關(guān)鍵詞用于描述檢測到的事件等……這些方法雖然對突發(fā)事件檢測的性能有所改善,但問題依然存在,而這些問題正是此次獲獎?wù)撐囊鉀Q的難點(diǎn)問題。
在本篇獲獎?wù)撐闹刑岢龅腂urst_NBT由兩部分構(gòu)成。第一部分,增強(qiáng)突發(fā)詞的檢測;第二部分,突發(fā)詞聚類與突發(fā)事件排序。增強(qiáng)突發(fā)詞的檢測由兩部分構(gòu)成,分別是有意義字符串字典的構(gòu)建與突發(fā)詞得分的計算。Burst_NBT利用微博中的hashtag與標(biāo)題等信息構(gòu)建有意義字符串字典,并利用突發(fā)詞的先驗信息計算突發(fā)詞得分,然后利用微博博文評論數(shù)平滑后的對數(shù)表示博文影響力。在大量數(shù)據(jù)集上的實驗結(jié)果驗證了Burst_NBT在突發(fā)事件檢測準(zhǔn)確率以及事件描述準(zhǔn)確性上均優(yōu)于其他方法。
注重產(chǎn)學(xué)研深度結(jié)合推動技術(shù)創(chuàng)新應(yīng)用
經(jīng)過多年的建設(shè),小i機(jī)器人目前已經(jīng)形成了三級技術(shù)研發(fā)體系:研究院—產(chǎn)品研發(fā)中心—解決方案中心。同時,小i機(jī)器人也非常重視產(chǎn)學(xué)研的深度結(jié)合,其中除了與華東師范大學(xué)、中國科學(xué)院軟件所、香港科技大學(xué)等建立了聯(lián)合實驗室外,也與中國科技大學(xué)、復(fù)旦大學(xué)、北京郵電大學(xué)、北京大學(xué)等建立了深度合作關(guān)系,在自然語言處理、文本挖掘及情感交互等多方面開展了深度研究工作。
小i機(jī)器人也一直將最新的認(rèn)知智能技術(shù)研究成果和落地應(yīng)用展示于國際頂級學(xué)術(shù)會議和賽事中。例如,小i機(jī)器人研究院團(tuán)隊在今年7月的國際權(quán)威機(jī)器閱讀理解評測SQuAD1.1挑戰(zhàn)賽中獨(dú)立參賽斬獲全球第三的成績;于今年8月再次參加IJCAI,分享在認(rèn)知智能相關(guān)技術(shù)領(lǐng)域的突破等。
小i機(jī)器人核心技術(shù)的不斷突破與進(jìn)階,將持續(xù)為社會、行業(yè)和客戶帶來更多價值。未來,小i機(jī)器人也將不斷加強(qiáng)與學(xué)界的合作,進(jìn)一步提升人工智能技術(shù)水平,確保以更成熟的人工智能技術(shù)為更多的行業(yè)企業(yè)客戶提供服務(wù)。