訂閱
糾錯(cuò)
加入自媒體

蘋果申請(qǐng)新專利 Siri可解讀用戶情緒

據(jù)蘋果14日提交的最新專利申請(qǐng)文件顯示,蘋果正在開(kāi)發(fā)一種全新的方法,通過(guò)在未來(lái)版本的Siri或者其他系統(tǒng)中添加面部分析功能,來(lái)幫助Siri解讀用戶需求。這意味著Siri將來(lái)可能不僅懂得語(yǔ)音識(shí)別,在與用戶進(jìn)行對(duì)話時(shí),它甚至可以啟用設(shè)備的FaceTime攝像頭,來(lái)分析用戶面部表情,解讀用戶情緒。

蘋果官方稱,申請(qǐng)這一專利的目的是減少語(yǔ)音請(qǐng)求被Siri誤解的次數(shù),試圖通過(guò)分析用戶情緒來(lái)進(jìn)一步提高準(zhǔn)確度。蘋果還提到:“Smart Apps可以代表用戶執(zhí)行操作,以回應(yīng)用戶的自然語(yǔ)言需求,但在某些情況下,可能會(huì)與用戶想要的操作并不符合。但是現(xiàn)在我們可以對(duì)視頻輸入中的面部圖像進(jìn)行分析,通過(guò)識(shí)別形狀或運(yùn)動(dòng)來(lái)識(shí)別特定的肌肉或肌肉組織是否被激活”。

目前人工智能較為成熟的應(yīng)用之一就是圖像和語(yǔ)音識(shí)別。圖像識(shí)別是指利用計(jì)算機(jī)對(duì)圖像進(jìn)行處理、分析和理解,以識(shí)別各種不同模式的目標(biāo)和對(duì)像的技術(shù)。得益于數(shù)字化時(shí)代帶來(lái)的海量數(shù)據(jù),加之機(jī)器學(xué)習(xí)方法的廣泛應(yīng)用,計(jì)算機(jī)視覺(jué)發(fā)展迅速。以往許多基于規(guī)則的處理方式,都被機(jī)器學(xué)習(xí)所替代:機(jī)器自動(dòng)從海量數(shù)據(jù)中總結(jié)歸納物體的特征,然后進(jìn)行識(shí)別和判斷。其已經(jīng)廣泛應(yīng)用到拍照識(shí)物、畫面增強(qiáng)、人機(jī)交互等各種領(lǐng)域,包括典型的相機(jī)人臉檢測(cè)、安防人臉識(shí)別、車牌識(shí)別等等。

神經(jīng)網(wǎng)絡(luò)圖像識(shí)別的發(fā)展,各類視覺(jué)識(shí)別的任務(wù)精度都得到了大幅提升。在全球最權(quán)威的計(jì)算機(jī)視覺(jué)競(jìng)賽ILSVR上,千類物體識(shí)別錯(cuò)誤率在2011年時(shí)還高達(dá)25.8%,從2012年引入深度學(xué)習(xí)之后,后續(xù)4年的錯(cuò)誤率分別達(dá)到了16.4%、11.7%、6.7%、3.7%,出現(xiàn)了顯著突破,F(xiàn)在,人臉識(shí)別甚至能做到誤判率低于百萬(wàn)分之一。

語(yǔ)音技術(shù)主要包括語(yǔ)音合成和語(yǔ)音識(shí)別兩項(xiàng)關(guān)鍵技術(shù)。讓機(jī)器說(shuō)話,用的是語(yǔ)音合成技術(shù);讓機(jī)器聽(tīng)懂人說(shuō)話,用的是語(yǔ)音識(shí)別技術(shù)。語(yǔ)音識(shí)別技術(shù)是指將人類語(yǔ)音中的詞匯內(nèi)容轉(zhuǎn)換為計(jì)算機(jī)可讀的輸入,例如按鍵、二進(jìn)制編碼或者字符序列,與說(shuō)話人識(shí)別及說(shuō)話人確認(rèn)不同,后者嘗試識(shí)別或確認(rèn)發(fā)出語(yǔ)音的說(shuō)話人而非其中所包含的詞匯內(nèi)容。此外,語(yǔ)音技術(shù)還包括語(yǔ)音編碼、音色轉(zhuǎn)換、口語(yǔ)評(píng)測(cè)、語(yǔ)音消噪和增強(qiáng)等技術(shù)。

科大訊飛作為智能語(yǔ)音識(shí)別領(lǐng)域的領(lǐng)跑者,在技術(shù)應(yīng)用中訊飛翻譯機(jī)3.0支持和7個(gè)領(lǐng)域的專業(yè)人士充分對(duì)話,覆蓋醫(yī)療、外貿(mào)、體育、金融、能源、計(jì)算機(jī)、法律等七大熱門行業(yè)的AI翻譯,同時(shí)支持粵語(yǔ)、四川話、東北話、河南話等中文方言與英語(yǔ)的互譯,普通話與維語(yǔ)、藏語(yǔ)的即時(shí)互譯。另外,即使是方言口音的英語(yǔ),訊飛翻譯機(jī)3.0也能識(shí)別。

語(yǔ)音識(shí)別技術(shù)從客服到智能家居,再到移動(dòng)手機(jī)端和車載環(huán)境等多方面具有廣泛的應(yīng)用場(chǎng)景。但語(yǔ)音識(shí)別還是有一些缺點(diǎn)的。語(yǔ)音隨時(shí)間而變化,所以必須使用生物識(shí)別模板。語(yǔ)音也會(huì)由于嗓音沙啞、情緒壓力或是外界環(huán)境影響而變化。語(yǔ)音識(shí)別系統(tǒng)比指紋識(shí)別系統(tǒng)有著較高的誤識(shí)率,因?yàn)槿藗兊穆曇舨幌裰讣y那樣獨(dú)特和唯一。

目前圖像與語(yǔ)音識(shí)別技術(shù)其很大程度上還是處于識(shí)別和歸類的層面,想要透過(guò)表層的識(shí)別去進(jìn)行深層的情緒認(rèn)識(shí)和理解,進(jìn)而優(yōu)化人機(jī)交互的體驗(yàn),尚需時(shí)日。

聲明: 本網(wǎng)站所刊載信息,不代表OFweek觀點(diǎn)?帽菊靖寮,務(wù)經(jīng)書面授權(quán)。未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制、翻譯及建立鏡像,違者將依法追究法律責(zé)任。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)