國內(nèi)AI領(lǐng)先技術(shù),語音識(shí)別未來的發(fā)展趨勢(shì)是怎樣的?
聲明:本文為火石創(chuàng)造原創(chuàng)文章,歡迎個(gè)人轉(zhuǎn)發(fā)分享,網(wǎng)站、公眾號(hào)等轉(zhuǎn)載需經(jīng)授權(quán)。
語音識(shí)別是發(fā)展未來人工智能(點(diǎn)擊閱讀:我國人工智能產(chǎn)業(yè)現(xiàn)狀及發(fā)展前景分析)的重要組成部分之一,是達(dá)到人機(jī)交互目的第一步,簡單來說,是機(jī)器或程序完成接受口令、解釋聲音含義、理解和執(zhí)行口頭指令所需的技術(shù)。本文將從行業(yè)政策環(huán)境、產(chǎn)業(yè)鏈、行業(yè)競爭格局、投資現(xiàn)狀等角度來剖析語音識(shí)別產(chǎn)業(yè)的發(fā)展現(xiàn)狀。
01行業(yè)政策環(huán)境
近年來,隨著科技的進(jìn)步,人工智能這一新興領(lǐng)域取得了快速發(fā)展,相關(guān)政策相繼出臺(tái)。
表1:人工智能相關(guān)政策匯總
來源:火石創(chuàng)造根據(jù)公開資料整理
在“十四五”的大背景和智能經(jīng)濟(jì)形態(tài)下,目前已有多個(gè)省市響應(yīng)中央號(hào)召,相繼發(fā)布人工智能相關(guān)規(guī)劃或?qū)m?xiàng)政策,以人工智能為技術(shù)手段,發(fā)揮當(dāng)?shù)禺a(chǎn)業(yè)集群優(yōu)勢(shì),促進(jìn)產(chǎn)學(xué)研融合及協(xié)同發(fā)展。同時(shí),語音識(shí)別技術(shù)屬于中國AI領(lǐng)域中最為成熟落地的技術(shù)之一,預(yù)計(jì)未來能夠繼續(xù)加速在各垂直行業(yè)進(jìn)行滲透和布局。
02產(chǎn)業(yè)鏈分析
圖1:語音識(shí)別產(chǎn)業(yè)圖譜來源:火石創(chuàng)造根據(jù)公開資料整理
中國人工智能語音識(shí)別產(chǎn)業(yè)鏈主要分為上游、中游、下游。
上游:基礎(chǔ)層技術(shù)提供算力與數(shù)據(jù)方面的強(qiáng)力支持——包含算力與AI數(shù)據(jù)服務(wù)。語音識(shí)別模型在運(yùn)行過程中訓(xùn)練數(shù)據(jù)量和計(jì)算量需求極大,由于傳統(tǒng)的CPU或者單一處理器進(jìn)行語音識(shí)別運(yùn)算的處理時(shí)間過長,所以無法滿足海量數(shù)據(jù)計(jì)算的實(shí)時(shí)性需求。目前,主流語音識(shí)別公司的模擬訓(xùn)練和語音識(shí)別基本都在云端采用GPU等計(jì)算芯片并行架構(gòu)或異構(gòu)計(jì)算方案進(jìn)行。
中游:技術(shù)層提供理論與技術(shù)支撐——包含基礎(chǔ)理論技術(shù)以及算法模型相關(guān)解決方案的形成,升級(jí)為相關(guān)軟硬件產(chǎn)品。
下游:應(yīng)用層提供技術(shù)落地應(yīng)用場景——包含企業(yè)端、消費(fèi)端、其他端場景。其中,企業(yè)端主要應(yīng)用于醫(yī)療、公檢法等;消費(fèi)端主要應(yīng)用于智能家居、智慧教育等。
03行業(yè)競爭格局
中國的人工智能語音識(shí)別主流廠商大致可分為互聯(lián)網(wǎng)IT廠商、語音技術(shù)廠商兩類。互聯(lián)網(wǎng)IT廠商典型包括阿里巴巴、騰訊、搜狗、百度等。這類廠商重視以流量導(dǎo)向和滿足龐大用戶群體驗(yàn)和創(chuàng)新需求為導(dǎo)向去做AI開發(fā),更多以流量和用戶體驗(yàn)為導(dǎo)向,同時(shí),會(huì)比傳統(tǒng)的語音技術(shù)廠商更加注重創(chuàng)新實(shí)踐。語音技術(shù)廠商典型包括科大訊飛、捷通華聲等擁有自身核心語音芯片以及相關(guān)軟件系統(tǒng)的傳統(tǒng)語音技術(shù)廠商,還有云知聲、思必馳等側(cè)重于某些垂直領(lǐng)域的語音技術(shù)和產(chǎn)品的創(chuàng)業(yè)廠商。在眾多廠商中,科大訊飛、騰訊、百度為典型競爭力代表。
科大訊飛:科大訊飛是國內(nèi)領(lǐng)先的智能語音技術(shù)主要提供商之一,在語音識(shí)別等智能語音技術(shù)領(lǐng)域擁有國際先進(jìn)的成果,主要業(yè)務(wù)包含智能語音和語言技術(shù)研究、軟件及芯片產(chǎn)品開發(fā)、語音信息服務(wù)及電子政務(wù)系統(tǒng)集成,為企業(yè)、政府和個(gè)人提供智能應(yīng)用。科大訊飛技術(shù)優(yōu)勢(shì)在同行業(yè)中出眾,擁有自主知識(shí)產(chǎn)權(quán)的智能語音技術(shù),推出覆蓋大型電信級(jí)應(yīng)用到小型嵌入式應(yīng)用以及滿足不同應(yīng)用環(huán)境的軟硬件產(chǎn)品。科大訊飛在中文語音技術(shù)市場和語音合成產(chǎn)品市場都占有較大份額,應(yīng)用于電信、金融、電力、社保等主流行業(yè)?拼笥嶏w結(jié)合自己核心的智能語音技術(shù)和人工智能的研究,已經(jīng)實(shí)現(xiàn)AI產(chǎn)品化的布局。在To B端,科大訊飛面向教育、政法、醫(yī)療、汽車和客服等多個(gè)行業(yè)提供相應(yīng)的解決方案。在To C端,科大訊飛提供面向消費(fèi)者的家庭、汽車、翻譯等個(gè)人消費(fèi)品,包括硬件產(chǎn)品如訊飛學(xué)習(xí)機(jī)、訊飛翻譯機(jī)、智能辦公本等,以及軟件產(chǎn)品如訊飛輸入法、AI電視助手等。
騰訊:騰訊云語音識(shí)別目前主要應(yīng)用于微信、王者榮耀、騰訊視頻等內(nèi)部業(yè)務(wù),外部應(yīng)用布局于錄音質(zhì)檢、會(huì)議實(shí)時(shí)轉(zhuǎn)寫、法庭及審訊記錄、語音輸入法等場景。技術(shù)提供主要功能為開放實(shí)時(shí)語音識(shí)別、一句話識(shí)別和錄音文件識(shí)別,支持云端和嵌入式兩種服務(wù)模式。騰訊云語音識(shí)別的主要優(yōu)勢(shì)在于有大量的用戶基礎(chǔ)和數(shù)據(jù)積累可應(yīng)用于豐富的行業(yè)場景,收費(fèi)價(jià)格較低,自準(zhǔn)率高達(dá)97%,支持多語言識(shí)別能力,有領(lǐng)先的算法。
百度:百度在AI開放平臺(tái)上提供語音識(shí)別的技術(shù),共享AI領(lǐng)域的應(yīng)用場景和解決方案,產(chǎn)品包括短語音識(shí)別、實(shí)時(shí)語音識(shí)別、遠(yuǎn)場語音識(shí)別、音頻文件轉(zhuǎn)寫、語音自訓(xùn)練平臺(tái)等,應(yīng)用于手機(jī)應(yīng)用如語音輸入、機(jī)器人對(duì)話、語音內(nèi)容分析和實(shí)時(shí)語音轉(zhuǎn)寫等場景。百度的語音識(shí)別技術(shù)優(yōu)勢(shì)在于領(lǐng)先的語音識(shí)別技術(shù),提供自助訓(xùn)練專屬模型,可簡單快速地接入API及多種SDK接口,提供穩(wěn)定性保障,且收取費(fèi)用較低。
04投資現(xiàn)狀
國內(nèi)人工智能產(chǎn)業(yè)發(fā)展較國外發(fā)展較晚,直至2011年方才展露出發(fā)展苗頭。語音識(shí)別作為人工智能產(chǎn)業(yè)中極其重要的一個(gè)組成部分,擔(dān)任著人機(jī)交互應(yīng)用時(shí)的輸入和輸出接口,也相應(yīng)地受到產(chǎn)業(yè)風(fēng)口的影響,受到一眾投資機(jī)構(gòu)的追捧。截至2021年2月,語音識(shí)別行業(yè)投資事件達(dá)150多件,投資金額達(dá)180億元左右。
圖2:我國語音識(shí)別產(chǎn)業(yè)投融資情況
來源:信通院
從投資輪次來看,A輪階段的語音識(shí)別企業(yè)更受資本方的青睞,投資額達(dá)50.24億元,投資事件達(dá)65次;其次,B、C、D、E輪次的投資相對(duì)平均;值得一提的是,對(duì)于早期項(xiàng)目,投資機(jī)構(gòu)雖然單筆投資金額較少,但投資事件相對(duì)較高,達(dá)24次。按照語音識(shí)別產(chǎn)業(yè)分輪次投融資占比來看,行業(yè)中吸引了絕大部分資金的企業(yè)基本上都聚集在A、B、C輪。
圖3:我國語音識(shí)別產(chǎn)業(yè)分輪次投融資情況來源:融中研究
圖4:我國語音識(shí)別產(chǎn)業(yè)分輪次投融資占比情況來源:融中研究
從語音識(shí)別產(chǎn)業(yè)內(nèi)企業(yè)產(chǎn)品/服務(wù)應(yīng)用方向來看,主要分為技術(shù)服務(wù)、教育、汽車交通、新工業(yè)、智能硬件、醫(yī)療、金融等幾個(gè)分類。其中,最為獲得投資機(jī)構(gòu)青睞的是技術(shù)服務(wù)方向的語音識(shí)別企業(yè),占據(jù)了投資金額及投資事件數(shù)的絕大部分,分別為116.49億元、89次投資。值得一提的是,語音識(shí)別技術(shù)應(yīng)用于汽車交通行業(yè)所獲得的投資件數(shù)雖然僅有4次,但單筆投資金額卻是最高的。
圖5:我國語音識(shí)別產(chǎn)業(yè)分行業(yè)投融資情況來源:融中研究
圖6:我國語音識(shí)別產(chǎn)業(yè)分行業(yè)投融資占比情況來源:融中研究
04總結(jié)
我國大力推動(dòng)新基建發(fā)展,其中5G、人工智能、云計(jì)算等作為輔助核心基礎(chǔ)設(shè)施也將得到進(jìn)一步加速發(fā)展,同時(shí)也會(huì)帶動(dòng)語音識(shí)別產(chǎn)業(yè)迎來更加廣闊的發(fā)展空間。未來,相信在國家政策的強(qiáng)力扶持與供應(yīng)商和開發(fā)者的共同努力下,語音識(shí)別產(chǎn)業(yè)會(huì)加速在垂直行業(yè)進(jìn)行滲透和布局,能夠更好地與其他語音交互技術(shù)及軟件功能融合,為消費(fèi)者提供更優(yōu)質(zhì)的體驗(yàn)。
參考文獻(xiàn)1. 《AI語音識(shí)別行業(yè)發(fā)展研究報(bào)告》.融資中國2. 《語音識(shí)別技術(shù)市場狀況和發(fā)展歷程》旺龍智能.2021.5.
—END— 作者 | 火石創(chuàng)造 金丹 審核 | 火石創(chuàng)造邵錢、殷莉編輯 | 火石創(chuàng)造 張艷玲運(yùn)營 | 火石創(chuàng)造 黃淑萍
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字
最新活動(dòng)更多
-
即日-10.29立即報(bào)名>> 2024德州儀器嵌入式技術(shù)創(chuàng)新發(fā)展研討會(huì)
-
10月31日立即下載>> 【限時(shí)免費(fèi)下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報(bào)名>>> 【在線會(huì)議】多物理場仿真助跑新能源汽車
-
11月14日立即報(bào)名>> 2024工程師系列—工業(yè)電子技術(shù)在線會(huì)議
-
12月19日立即報(bào)名>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
即日-12.26火熱報(bào)名中>> OFweek2024中國智造CIO在線峰會(huì)
推薦專題
- 1 Intel宣布40年來最重大轉(zhuǎn)型:年底前裁員15000人、拋掉2/3房產(chǎn)
- 2 因美封殺TikTok,字節(jié)股價(jià)骨折!估值僅Meta1/5
- 3 宏山激光重磅發(fā)布行業(yè)解決方案,助力智能制造產(chǎn)業(yè)新飛躍
- 4 國產(chǎn)AI芯片公司破產(chǎn)!白菜價(jià)拍賣
- 5 具身智能火了,但規(guī)模落地還需時(shí)間
- 6 國產(chǎn)英偉達(dá)們,抓緊沖刺A股
- 7 三次錯(cuò)失風(fēng)口!OpenAI前員工殺回AI編程賽道,老東家捧金相助
- 8 英特爾賦能智慧醫(yī)療,共創(chuàng)數(shù)字化未來
- 9 英偉達(dá)的麻煩在后頭?
- 10 將“網(wǎng)紅”變成“商品”,AI“爆改”實(shí)力拉滿
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市