蘋果申請(qǐng)新專利 Siri可解讀用戶情緒
據(jù)蘋果14日提交的最新專利申請(qǐng)文件顯示,蘋果正在開(kāi)發(fā)一種全新的方法,通過(guò)在未來(lái)版本的Siri或者其他系統(tǒng)中添加面部分析功能,來(lái)幫助Siri解讀用戶需求。這意味著Siri將來(lái)可能不僅懂得語(yǔ)音識(shí)別,在與用戶進(jìn)行對(duì)話時(shí),它甚至可以啟用設(shè)備的FaceTime攝像頭,來(lái)分析用戶面部表情,解讀用戶情緒。
蘋果官方稱,申請(qǐng)這一專利的目的是減少語(yǔ)音請(qǐng)求被Siri誤解的次數(shù),試圖通過(guò)分析用戶情緒來(lái)進(jìn)一步提高準(zhǔn)確度。蘋果還提到:“Smart Apps可以代表用戶執(zhí)行操作,以回應(yīng)用戶的自然語(yǔ)言需求,但在某些情況下,可能會(huì)與用戶想要的操作并不符合。但是現(xiàn)在我們可以對(duì)視頻輸入中的面部圖像進(jìn)行分析,通過(guò)識(shí)別形狀或運(yùn)動(dòng)來(lái)識(shí)別特定的肌肉或肌肉組織是否被激活”。
目前人工智能較為成熟的應(yīng)用之一就是圖像和語(yǔ)音識(shí)別。圖像識(shí)別是指利用計(jì)算機(jī)對(duì)圖像進(jìn)行處理、分析和理解,以識(shí)別各種不同模式的目標(biāo)和對(duì)像的技術(shù)。得益于數(shù)字化時(shí)代帶來(lái)的海量數(shù)據(jù),加之機(jī)器學(xué)習(xí)方法的廣泛應(yīng)用,計(jì)算機(jī)視覺(jué)發(fā)展迅速。以往許多基于規(guī)則的處理方式,都被機(jī)器學(xué)習(xí)所替代:機(jī)器自動(dòng)從海量數(shù)據(jù)中總結(jié)歸納物體的特征,然后進(jìn)行識(shí)別和判斷。其已經(jīng)廣泛應(yīng)用到拍照識(shí)物、畫面增強(qiáng)、人機(jī)交互等各種領(lǐng)域,包括典型的相機(jī)人臉檢測(cè)、安防人臉識(shí)別、車牌識(shí)別等等。
神經(jīng)網(wǎng)絡(luò)圖像識(shí)別的發(fā)展,各類視覺(jué)識(shí)別的任務(wù)精度都得到了大幅提升。在全球最權(quán)威的計(jì)算機(jī)視覺(jué)競(jìng)賽ILSVR上,千類物體識(shí)別錯(cuò)誤率在2011年時(shí)還高達(dá)25.8%,從2012年引入深度學(xué)習(xí)之后,后續(xù)4年的錯(cuò)誤率分別達(dá)到了16.4%、11.7%、6.7%、3.7%,出現(xiàn)了顯著突破,F(xiàn)在,人臉識(shí)別甚至能做到誤判率低于百萬(wàn)分之一。
語(yǔ)音技術(shù)主要包括語(yǔ)音合成和語(yǔ)音識(shí)別兩項(xiàng)關(guān)鍵技術(shù)。讓機(jī)器說(shuō)話,用的是語(yǔ)音合成技術(shù);讓機(jī)器聽(tīng)懂人說(shuō)話,用的是語(yǔ)音識(shí)別技術(shù)。語(yǔ)音識(shí)別技術(shù)是指將人類語(yǔ)音中的詞匯內(nèi)容轉(zhuǎn)換為計(jì)算機(jī)可讀的輸入,例如按鍵、二進(jìn)制編碼或者字符序列,與說(shuō)話人識(shí)別及說(shuō)話人確認(rèn)不同,后者嘗試識(shí)別或確認(rèn)發(fā)出語(yǔ)音的說(shuō)話人而非其中所包含的詞匯內(nèi)容。此外,語(yǔ)音技術(shù)還包括語(yǔ)音編碼、音色轉(zhuǎn)換、口語(yǔ)評(píng)測(cè)、語(yǔ)音消噪和增強(qiáng)等技術(shù)。
科大訊飛作為智能語(yǔ)音識(shí)別領(lǐng)域的領(lǐng)跑者,在技術(shù)應(yīng)用中訊飛翻譯機(jī)3.0支持和7個(gè)領(lǐng)域的專業(yè)人士充分對(duì)話,覆蓋醫(yī)療、外貿(mào)、體育、金融、能源、計(jì)算機(jī)、法律等七大熱門行業(yè)的AI翻譯,同時(shí)支持粵語(yǔ)、四川話、東北話、河南話等中文方言與英語(yǔ)的互譯,普通話與維語(yǔ)、藏語(yǔ)的即時(shí)互譯。另外,即使是方言口音的英語(yǔ),訊飛翻譯機(jī)3.0也能識(shí)別。
語(yǔ)音識(shí)別技術(shù)從客服到智能家居,再到移動(dòng)手機(jī)端和車載環(huán)境等多方面具有廣泛的應(yīng)用場(chǎng)景。但語(yǔ)音識(shí)別還是有一些缺點(diǎn)的。語(yǔ)音隨時(shí)間而變化,所以必須使用生物識(shí)別模板。語(yǔ)音也會(huì)由于嗓音沙啞、情緒壓力或是外界環(huán)境影響而變化。語(yǔ)音識(shí)別系統(tǒng)比指紋識(shí)別系統(tǒng)有著較高的誤識(shí)率,因?yàn)槿藗兊穆曇舨幌裰讣y那樣獨(dú)特和唯一。
目前圖像與語(yǔ)音識(shí)別技術(shù)其很大程度上還是處于識(shí)別和歸類的層面,想要透過(guò)表層的識(shí)別去進(jìn)行深層的情緒認(rèn)識(shí)和理解,進(jìn)而優(yōu)化人機(jī)交互的體驗(yàn),尚需時(shí)日。
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
即日-10.29立即報(bào)名>> 2024德州儀器嵌入式技術(shù)創(chuàng)新發(fā)展研討會(huì)
-
10月31日立即下載>> 【限時(shí)免費(fèi)下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報(bào)名>>> 【在線會(huì)議】多物理場(chǎng)仿真助跑新能源汽車
-
11月14日立即報(bào)名>> 2024工程師系列—工業(yè)電子技術(shù)在線會(huì)議
-
12月19日立即報(bào)名>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
即日-12.26火熱報(bào)名中>> OFweek2024中國(guó)智造CIO在線峰會(huì)
推薦專題
- 1 Intel宣布40年來(lái)最重大轉(zhuǎn)型:年底前裁員15000人、拋掉2/3房產(chǎn)
- 2 因美封殺TikTok,字節(jié)股價(jià)骨折!估值僅Meta1/5
- 3 宏山激光重磅發(fā)布行業(yè)解決方案,助力智能制造產(chǎn)業(yè)新飛躍
- 4 國(guó)產(chǎn)AI芯片公司破產(chǎn)!白菜價(jià)拍賣
- 5 具身智能火了,但規(guī)模落地還需時(shí)間
- 6 國(guó)產(chǎn)英偉達(dá)們,抓緊沖刺A股
- 7 三次錯(cuò)失風(fēng)口!OpenAI前員工殺回AI編程賽道,老東家捧金相助
- 8 英特爾賦能智慧醫(yī)療,共創(chuàng)數(shù)字化未來(lái)
- 9 英偉達(dá)的麻煩在后頭?
- 10 將“網(wǎng)紅”變成“商品”,AI“爆改”實(shí)力拉滿
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市