關(guān)鍵詞:國內(nèi)外智能語音 智能語音
中投顧問:2018-2022年國內(nèi)外智能語音發(fā)展的分析
國際智能語音發(fā)展歷程
綜觀全球,智能語音產(chǎn)業(yè)發(fā)展歷程可分為四個階段。第一階段是技術(shù)萌芽階段(20世紀50——70年代),以孤立詞和少詞匯量句子識別,并通過關(guān)鍵詞匹配實現(xiàn)簡單命令操作為主要內(nèi)容,AT&T貝爾實驗室開發(fā)的Audrey語音識別系統(tǒng)是其主要標志。Audrey能夠通過跟蹤語音中的共振峰,識別10個英文數(shù)字,正確率高達98%。
第二階段是技術(shù)突破階段(20世紀80年代),語音識別和自然語言處理技術(shù)有了較大進展。智能語音技術(shù)研究由傳統(tǒng)的基于標準模板匹配的技術(shù)思路開始轉(zhuǎn)向基于統(tǒng)計模型(HMM)的技術(shù)思路,并再次提出了將神經(jīng)網(wǎng)絡(luò)技術(shù)引入語音識別問題的技術(shù)思路。
第三階段是產(chǎn)業(yè)化階段(20世紀90年代到21世紀初),智能語音技術(shù)由研究走向?qū)嵱貌㈤_始產(chǎn)業(yè)化,以1997年IBM推出的ViaVoice為重要標志。自此,智能語音產(chǎn)品開始進入呼叫中心、家電、汽車等各個領(lǐng)域。比如,上世紀70年代由美國國防部遠景研究計劃局資助的,旨在支持語言理解系統(tǒng)的研究開發(fā)工作的計劃DARPA,進入90年代后,研究重點已轉(zhuǎn)向識別裝置中的自然語言處理部分,識別任務(wù)設(shè)定為“航空旅行信息檢索”。
第四個階段是快速應(yīng)用階段(2010年以后),以蘋果Siri的發(fā)布為重要引爆點,智能語音應(yīng)用領(lǐng)域由傳統(tǒng)行業(yè)開始向移動互聯(lián)網(wǎng)等新興領(lǐng)域延伸。在發(fā)達國家,大量的語音識別產(chǎn)品已經(jīng)進入市場和服務(wù)領(lǐng)域并取得很好的效果。
圖表 國際智能語音產(chǎn)業(yè)發(fā)展歷程
資料來源:中投顧問產(chǎn)業(yè)研究中心整理
國內(nèi)智能語音發(fā)展時期
中投顧問發(fā)布的《2018-2022年中國智能語音行業(yè)深度調(diào)研及投資前景預(yù)測報告》顯示我國智能語音市場主要分為四個時期:探索期(2007-2011)、市場啟動期(2012-2016)、高速發(fā)展期(2017-)和應(yīng)用成熟期。在探索期,深度學(xué)習算法的應(yīng)用大大推動了語音識別領(lǐng)域的發(fā)展進程,其中具有代表性的是蘋果在2011年推出了Siri語音助手;在市場啟動期,各廠商發(fā)布了帶有的語音識別的智能終端,具有代表性的是亞馬遜發(fā)布智能音箱Echo,體現(xiàn)了人機交互功能;預(yù)計從2017年開始智能語音將進入高速發(fā)展期。
我國智能語音市場整體處于啟動期,智能車載,智能家居,智能可穿戴等垂直領(lǐng)域處于爆發(fā)前夜。
圖表 中國智能語音市場AMC模型
資料來源:中投顧問產(chǎn)業(yè)研究中心整理