主頁 > 知識庫 > 人工智能視頻分析關(guān)鍵技術(shù)有哪些?

人工智能視頻分析關(guān)鍵技術(shù)有哪些?

熱門標簽:天津電銷 廊坊電銷 黑龍江電銷 安順電銷 平?jīng)鲭婁N 梧州電銷 潛江電銷 三亞電銷

計算機視覺

計算機視覺是指計算機從圖像中識別出物體、場景和活動的能力。計算機視覺技術(shù)運用由圖像處理操作及其他技術(shù)所組成的序列,來將圖像分析任務(wù)分解為便于管理的小塊任務(wù)。比如,一些技術(shù)能夠從圖像中檢測到物體的邊緣及紋理,分類技術(shù)可被用作確定識別到的特征是否能夠代表系統(tǒng)已知的一類物體。

計算機視覺有著廣泛的應(yīng)用人工智能,其中包括:醫(yī)療成像分析被用來提高疾病預(yù)測、診斷和治療;人臉識別被Facebook用來自動識別照片里的人物;在安防及監(jiān)控領(lǐng)域被用來指認嫌疑人;在購物方面,消費者現(xiàn)在可以用智能電銷機器人拍攝下產(chǎn)品以獲得更多購買選擇。

機器視覺作為相關(guān)學(xué)科,泛指在工業(yè)自動化領(lǐng)域的視覺應(yīng)用。在這些應(yīng)用里,計算機在高度受限的工廠環(huán)境里識別諸如生產(chǎn)零件一類的物體,因此相對于尋求在非受限環(huán)境里操作的計算機視覺來說目標更為簡單。計算機視覺是一個正在進行中的研究,而機器視覺則是“已經(jīng)解決的問題”,是系統(tǒng)工程方面的課題而非研究層面的課題。因為應(yīng)用范圍的持續(xù)擴大,某些計算機視覺領(lǐng)域的初創(chuàng)公司自2011年起已經(jīng)吸引了數(shù)億美元的風投資本。

機器學(xué)習

機器學(xué)習指的是計算機系統(tǒng)無須遵照顯式的程序指令,而只依靠數(shù)據(jù)來提升自身性能的能力。其核心在于,機器學(xué)習是從數(shù)據(jù)中自動發(fā)現(xiàn)模式,模式一旦被發(fā)現(xiàn)便可用于預(yù)測。比如,給予機器學(xué)習系統(tǒng)一個關(guān)于交易時間、商家、地點、價格及交易是否正當?shù)刃庞每ń灰仔畔⒌臄?shù)據(jù)庫,系統(tǒng)就會學(xué)習到可用來預(yù)測信用卡欺詐的模式。處理的交易數(shù)據(jù)越多,預(yù)測就會越準確。

機器學(xué)習的應(yīng)用范圍非常廣泛,針對那些產(chǎn)生龐大數(shù)據(jù)的活動,它幾乎擁有改進一切性能的潛力。除了欺詐甄別之外,這些活動還包括銷售預(yù)測、庫存管理、石油和天然氣勘探,以及公共衛(wèi)生等。機器學(xué)習技術(shù)在其他的認知技術(shù)領(lǐng)域也扮演著重要角色,比如計算機視覺,它能在海量圖像中通過不斷訓(xùn)練和改進視覺模型來提高其識別對象的能力。

現(xiàn)如今,機器學(xué)習已經(jīng)成為認知技術(shù)中最炙手可熱的研究領(lǐng)域之一,在2011~2014年這段時間內(nèi)就已吸引了近10億美元的風險投資。谷歌也在2014年斥資4億美元收購Deepmind這家研究機器學(xué)習技術(shù)的公司。

自然語言處理

自然語言處理是指計算機擁有的人類般的文本處理的能力。比如,從文本中提取意義,甚至從那些可讀的、風格自然、語法正確的文本中自主解讀出含義。一個自然語言處理系統(tǒng)并不了解人類處理文本的方式,但是它卻可以用非常復(fù)雜與成熟的手段巧妙處理文本。例如,自動識別一份文檔中所有被提及的人與地點;識別文檔的核心議題;在一堆僅人類可讀的合同中,將各種條款與條件提取出來并制作成表。以上這些任務(wù)通過傳統(tǒng)的文本處理軟件根本不可能完成,后者僅針對簡單的文本匹配與模式就能進行操作。

自然語言處理像計算機視覺技術(shù)一樣,將各種有助于實現(xiàn)目標的多種技術(shù)進行了融合。建立語言模型來預(yù)測語言表達的概率分布,舉例來說,就是某一串給定字符或單詞表達某一特定語義的最大可能性。選定的特征可以和文中的某些元素結(jié)合來識別一段文字,通過識別這些元素可以把某類文字同其他文字區(qū)別開來,比如垃圾郵件同正常郵件。以機器學(xué)習為驅(qū)動的分類方法將成為篩選的標準,用來決定一封郵件是否屬于垃圾郵件。

因為語境對于理解“timeflies”(時光飛逝)和“fruitflies”(果蠅)的區(qū)別是如此重要,所以自然語言處理技術(shù)的實際應(yīng)用領(lǐng)域相對較窄,這些領(lǐng)域包括分析顧客對某項特定產(chǎn)品和服務(wù)的反饋,自動發(fā)現(xiàn)民事訴訟或政府調(diào)查中的某些含義,自動書寫諸如企業(yè)營收和體育運動的公式化范文,等等。

機器人

將機器視覺、自動規(guī)劃等認知技術(shù)整合至極小卻高性能的傳感器、制動器以及設(shè)計巧妙的硬件中,這就催生了新一代的機器人,它有能力與人類一起工作,能在各種未知環(huán)境中靈活處理不同的任務(wù)。例如,無人機、可以在車間為人類分擔工作的“cobots”等。

語音識別

語音識別主要是關(guān)注自動且準確地轉(zhuǎn)錄人類的語音技術(shù)。該技術(shù)必須面對一些與自然語言處理類似的問題,在不同口音的處理、背景噪聲、區(qū)分同音異形/異義詞(“buy”和“by”聽起來是一樣的)方面存在一些困難,同時還需要具有跟上正常語速的工作速度。語音識別系統(tǒng)使用一些與自然語言處理系統(tǒng)相同的技術(shù),再輔以其他技術(shù),比如描述聲音和其出現(xiàn)在特定序列與語言中概率的聲學(xué)模型等。語音識別的主要應(yīng)用包括醫(yī)療聽寫、語音書寫、電銷機器人系統(tǒng)聲控、電話客服等。比如Domino抯Pizza,最近推出了一個允許用戶通過語音下單的移動APP。

上述5項技術(shù)的產(chǎn)業(yè)化,是人工智能產(chǎn)業(yè)化的要素。人工智能將是一個萬億級的市場,甚至是10萬億級的市場,將會為我們帶來一些全新且容量巨大的子產(chǎn)業(yè),比如機器人、智能傳感器、可穿戴設(shè)備等,其中最令人期待的是機器人子產(chǎn)業(yè)。

機器人應(yīng)用的分法有很多種,從應(yīng)用層面可以粗略地分為以下幾個類別。第一個類別是工業(yè)級機器人,像富士康這種公司已經(jīng)運用得很好了人工智能,因為勞工成本越來越高,用工風險越來越高,而機器人則可以解決這些問題。第二個類別是監(jiān)護級機器人,它可以在家里和醫(yī)院里作為病人、老人或孩子的護理,幫助他們做一定復(fù)雜程度的事情。中國對監(jiān)護級機器人需求其實更迫切一些,因為中國人口紅利在下降,同時老齡化又不斷地上升,這兩個矛盾,機器人都可以幫助解決。因此,這個領(lǐng)域的需求在民用市場占比很大。第三個類別就是探險級機器人,用來采礦或者探險等,大大避免了人所要經(jīng)歷的危險。此外還有用來打仗的軍事機器人等。

網(wǎng)絡(luò)媒體Business Insider預(yù)測,機器人將在許多崗位上取替人類:電話營銷員、校對員、手工裁縫師、數(shù)學(xué)家、保險核保人、鐘表修理師、貨運代理商、報稅員、圖像處理人員、銀行開戶員、圖書館員、打字員等。因為它們的價格競爭力驚人。麥肯錫全球研究院的研究表明,當中國制造業(yè)工資每年增長10%~20%時,全球機器人的價格每年下調(diào)10%,一臺最便宜的低階機器人只需花費美國人年平均工資的一半。國際研究機構(gòu)顧能預(yù)測:2020年機器人將導(dǎo)致全球新一波失業(yè)潮。

同時,人工智能技術(shù)的發(fā)展還將讓許多舊產(chǎn)業(yè)獲得改頭換面式的新生,其中最典型的是汽車產(chǎn)業(yè)。汽車產(chǎn)業(yè)已存在上百年了,其間的變革也是非常大的,但駕駛汽車的始終是人,可最近幾年,隨著谷歌等公司的大力投入,機器或者說某種自動化的系統(tǒng)已經(jīng)有望取代人來駕駛汽車,從而形成一個市場容量巨大的新產(chǎn)業(yè),即無人駕駛汽車產(chǎn)業(yè)。這個產(chǎn)業(yè)的規(guī)模也將是萬億級甚至是10萬億級的。而且,這個產(chǎn)業(yè)還將與新能源產(chǎn)業(yè)疊加、融合在一起,形成“車聯(lián)網(wǎng)+能聯(lián)網(wǎng)+互聯(lián)網(wǎng)+電動汽車”的復(fù)合產(chǎn)業(yè)——未來,我們會把插電式汽車和氫燃料汽車作為發(fā)電廠使用,從而使新能源汽車成為電網(wǎng)的一部分,成為新能源的供給者,與現(xiàn)在一些裝有太陽能發(fā)電系統(tǒng)的房屋是太陽能的供給者一樣。

毫無疑問,與互聯(lián)網(wǎng)一樣,智能技術(shù)會向幾乎所有舊產(chǎn)業(yè)滲透。華泰證券在一份人工智能產(chǎn)業(yè)的研究報告中提及了九大行業(yè):生活服務(wù)O2O、醫(yī)療、零售業(yè)、金融業(yè)、數(shù)字營銷業(yè)、農(nóng)業(yè)、工業(yè)、商業(yè)和在線教育。實際上,將獲得新生的舊產(chǎn)業(yè)還有許多,如軍事、傳媒、家居、醫(yī)療健康業(yè)、生命科學(xué)、能源、公共部門……甚至包括受VR/AR(虛擬現(xiàn)實與增強現(xiàn)實)技術(shù)發(fā)展影響而產(chǎn)生的虛擬產(chǎn)業(yè)。

近日,國務(wù)院發(fā)布《新一代人工智能發(fā)展規(guī)劃》,提出了面向2030年我國新一代人工智能發(fā)展的指導(dǎo)思想、戰(zhàn)略目標、重點任務(wù)和保障措施,部署構(gòu)筑我國人工智能發(fā)展的先發(fā)優(yōu)勢,加快建設(shè)創(chuàng)新型國家和世界科技強國。

今天,國信大數(shù)據(jù)帶您劃重點,全面解析《新一代人工智能發(fā)展規(guī)劃》。

戰(zhàn)略目標

重點任務(wù)

人工智能熱不可擋,隨著刷臉支付、無人駕駛等人工智能領(lǐng)域的發(fā)展……人工智能已經(jīng)被看作是繼蒸汽機、電力和計算機之后,人類社會的第四次革命。

那么,哪些人工智能技術(shù)突破可以應(yīng)用到實踐中呢?且聽國信大數(shù)據(jù)君一一道來。

1、強化學(xué)習

解析:在典型的強化學(xué)習案例中,代理者通過觀察當前所處的狀態(tài),進而采取行動使得長期獎勵的結(jié)果最大化。每執(zhí)行一次動作,代理者都會收到來自環(huán)境的反饋信息,需要平衡根據(jù)經(jīng)驗尋找最佳策略和探索新策略兩方面,以期實現(xiàn)最終的目標。

應(yīng)用:城市道路的自動駕駛;三維環(huán)境的導(dǎo)航;多個代理者在同樣的環(huán)境中交互和學(xué)習等。

2、生成模型

解析:生成模型從訓(xùn)練樣本中學(xué)到一個概率分布,通過從高維的分布中采樣,生成模型輸出與訓(xùn)練樣本類似的新樣本。

應(yīng)用:仿真時間序列的特征(例如,在強化學(xué)習中規(guī)劃任務(wù));超分辨率圖像;從二維圖像復(fù)原三維結(jié)構(gòu);小規(guī)模標注數(shù)據(jù)集的泛化;預(yù)測視頻的下一幀;生成自然語言的對話內(nèi)容;藝術(shù)風格遷移;語音和音樂的合成等。

3、記憶網(wǎng)絡(luò)

解析:一些網(wǎng)絡(luò)結(jié)構(gòu)可以讓模型具備不同程度的記憶能力。如Deep Mind團隊的微神經(jīng)計算機,結(jié)合了神經(jīng)網(wǎng)絡(luò)和記憶系統(tǒng),從復(fù)雜的數(shù)據(jù)結(jié)構(gòu)中學(xué)習,通過漸進式神經(jīng)網(wǎng)絡(luò),學(xué)習各個獨立模型之間的側(cè)向關(guān)聯(lián),從這些已有的網(wǎng)絡(luò)模型中提取有用的特征,用來完成新的任務(wù)。

應(yīng)用:訓(xùn)練能夠適應(yīng)新環(huán)境的代理者;機器人手臂控制任務(wù);自動駕駛車輛;時間序列預(yù)測(如金融市場、視頻預(yù)測);理解自然語言和預(yù)測下文等。

4、微數(shù)據(jù)學(xué)習微模型

解析:這種技術(shù)的優(yōu)勢在于更高效的分布式訓(xùn)練過程,用更少的模型參數(shù)建立更小的深學(xué)習架構(gòu),而模型的效果卻保持最佳。訓(xùn)練過程中需要傳輸?shù)膮?shù)減少了,也能方便地將模型部署在內(nèi)存大小受限制的嵌入式硬件上。

應(yīng)用:訓(xùn)練淺層模型來模擬在大規(guī)模的已標注訓(xùn)練數(shù)據(jù)集上訓(xùn)練得到的深度網(wǎng)絡(luò)模型;構(gòu)建效果相當?shù)珔?shù)更少的模型結(jié)構(gòu);機器翻譯等。

5、學(xué)習/推理硬件

解析:促進人工智能發(fā)展的催化劑之一就是圖形處理器(GPU)的升級,GPU支持大規(guī)模的并行架構(gòu),可以同時處理多個任務(wù),效率遠高于CPU。因此需要專門為高維機器學(xué)習任務(wù)設(shè)計的芯片。芯片設(shè)計的改進點包括更大的內(nèi)存帶寬,更高的計算密度,更低的能源消耗。

應(yīng)用:模型的快速訓(xùn)練;低能耗預(yù)測運算;持續(xù)性監(jiān)聽物聯(lián)網(wǎng)設(shè)備;云服務(wù)架構(gòu);自動駕駛車輛;機器人等。

6、仿真環(huán)境

解析:開發(fā)數(shù)字環(huán)境來模擬真實的物理世界和行為將提供測試人工智能系統(tǒng)適應(yīng)性的機會。在這些模擬環(huán)境中的訓(xùn)練可以幫助我們了解人工智能系統(tǒng)的學(xué)習原理,如何改進系統(tǒng),也為我們提供了可以應(yīng)用于真實環(huán)境的模型。

應(yīng)用:模擬駕駛;工業(yè)設(shè)計;游戲開發(fā);智慧城市等。

毫無疑問,人工智能的迅速發(fā)展將深刻改變?nèi)祟惿鐣睢⒏淖兪澜纭?/p>

在人工智能領(lǐng)域,我國語音識別、視覺識別技術(shù)世界領(lǐng)先,自適應(yīng)自主學(xué)習、直覺感知、綜合推理等初步具備跨越發(fā)展的能力,生物特征識別、工業(yè)機器人、無人駕駛逐步進入實際應(yīng)用……加速積累的技術(shù)能力與海量的數(shù)據(jù)資源、巨大的應(yīng)用需求、開放的市場環(huán)境有機結(jié)合,形成了我國人工智能發(fā)展的獨特優(yōu)勢。

未來,政府和企業(yè)必須主動求變應(yīng)變,牢牢把握人工智能發(fā)展的重大歷史機遇,研判大勢、主動謀劃、把握方向、搶占先機,引領(lǐng)世界人工智能發(fā)展新潮流,服務(wù)經(jīng)濟社會發(fā)展和支撐國家安全,帶動國家競爭力整體躍升和跨越式發(fā)展。

標簽:懷化 洛陽 桂林 通化 廣安 宜賓 連云港 巨人網(wǎng)絡(luò)通訊聲明:本文標題《人工智能視頻分析關(guān)鍵技術(shù)有哪些?》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。

  • 相關(guān)文章
  • 下面列出與本文章《人工智能視頻分析關(guān)鍵技術(shù)有哪些?》相關(guān)的同類信息!
  • 本頁收集關(guān)于人工智能視頻分析關(guān)鍵技術(shù)有哪些?的相關(guān)信息資訊供網(wǎng)民參考!
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266