【OFweek 年終盤點】NLP、NLU 2017又有哪些新動作?
AI的應用技術層主要圍繞計算機視覺和語音、自然語言處理/理解。具體來說,自然語言處理任務又可以分為問答系統(tǒng)(如Siri、小娜等)、情感分析、圖片題注、機器翻譯、詞性標注、命名等幾個部分。
上一期我們盤點了計算機視覺2017年所發(fā)生的大事件,這一期的主要內容為計算機視覺和語音、自然語言處理/理解(NLP/NLU)。
國際
Maluuba:被微軟收購 推出可視化數(shù)據(jù)集FigureQA
1月,微軟宣布,公司已經(jīng)收購以使用針對自然語言處理的深度學習技術為重點,位于多倫多的人工智能初創(chuàng)企業(yè)Maluuba。通過這次收購,微軟旨在進一步強化機器閱讀和編寫能力。據(jù)了解,Maluuba的人工智能系統(tǒng)能夠以接近自然人的能力閱讀和理解文本內容。
10月,aluuba推出了一個用于推理的可視化數(shù)據(jù)集FigureQA,并將研究相關論文《FigureQA: An Annotated Figure Dataset for Visual Reasoning》發(fā)布在ArXiv上。據(jù)了解,通過對結構化視覺信息的理解能幫助人們從大量文獻中提取信息。
亞馬遜&微軟:聯(lián)手語音助手 能否成功“狙擊”Google?
8月,隨著亞馬遜CEO貝索斯發(fā)了一條推文表示:“Alexa剛剛交了個新朋友”,亞馬遜與微軟走到了一起,這讓原本競爭激烈的語音助手Alexa和Cortana成了一家人,而這一合作也被外界解讀為“狙擊”Siri和Google Assistant的最好方法。
兩者選擇合作最重要的原因是軟硬結合。微軟與亞馬遜的主攻方向有所不同,Cortana更加偏向專業(yè)領域,直接打通了Office 365與Cortana,Alexa則擅長勸用戶在亞馬遜上購物。如今,微軟Cortana的月活躍用戶已達1.45億,而搭載Alexa的亞馬遜Echo音箱則是智能音箱市場當之無愧的統(tǒng)治者。
三星:Bixby2.0和Bixby中文版先后推出 智能語音領域再添巨頭
10月,在三星開發(fā)者峰會上,語音助手Bixby2.0正式推出。據(jù)了解,Bixby2.0采用了應用深度集成的方式,支持自然語言處理功能,如自然語言命令和復雜語音處理,可以真正了解用戶和家庭成員。通過不斷深度學習用戶習慣及行為模式,可以成為個人化的人工智能秘書。據(jù)了解,三星將向第三方完全公開開發(fā)者工具,打造對抗亞馬遜Alexa和谷歌Assistant的人工智能助手開發(fā)平臺。
11月,在北京亦創(chuàng)國際會展中心,Bixby中文版正式發(fā)布,并11月30日在國內正式上線,國行版三星 Galaxy S8、S8+ 和 Note 8 將率先支持。
Yandex:俄羅斯最大搜索引擎推出語音助手Alice
Yandex是俄羅斯最大的搜索引擎,占領俄羅斯約65%的搜索市場份額,其在俄羅斯的地位相當于世界的Google和中國的百度。10月,根據(jù)俄羅斯媒體的消息,Yandex公布了Alice語音助手,該產品類似亞馬遜的Alexa。
據(jù)了解,Alice語音助手能夠展示接近人類水平的語言識別準確度,可以響應更隨意的查詢和基于上下文線索獲取信息。此外,相較于其它語音助手,Alice還有一個更加優(yōu)越的功能是“Chit-Chat”,這款功能讓語音助手更加擅長于對話。
SoundHound:與ModiFace達成合作 AI工具嵌入到AR鏡像
5月,推出了“美妝直播”的ModiFace和“搜歌利器”SoundHound宣布達成合作,共同推出“美妝魔鏡”。
據(jù)了解,SoundHound的語音AI工具將被嵌入到ModiFace的AR鏡像軟件中,用戶因此可以通過語音控制軟件,借助 AI 語音,這些需求可以被即時識別,系統(tǒng)會為用戶匹配相應的產品類型和色號,幫助用戶進行實時試妝。
國內
科大訊飛:語音語義三大領域實現(xiàn)突破
語音合成:在今年的Blizzard Challenge國際權威語音合成比賽上,科大訊飛以率先超過4.0分的成績連續(xù)12年蟬聯(lián)全球第一名,且依然是全世界唯一能讓語音合成技術能夠達到真人說話水平的應用。
語音識別:今年,科大訊飛將其語音識別準確率提升至98%。此外,在方言的識別方面,相對指標比2016年提升了50%以上,方言識別準確率超過90%的已經(jīng)接近十種,包括粵語、四川話、東北話、河南話、天津話、山東話、貴州話、寧夏話等。
語言文字識別:2017年,科大訊飛英文手寫識別準確率由去年的92%達到97%,全世界排名第一。對數(shù)學題目中的圖形識別,準確率達到92%以上。
搜狗:推出唇語識別新技術 準確率超谷歌達60%以上
12月,搜狗在北京舉行的媒體溝通會上公開演示了唇語識別新技術。據(jù)了解,搜狗通過攝像頭從圖像中連續(xù)識別出人的唇形,提取說話人連續(xù)的口型變化特征,然后將這些唇語特征放入唇語識別模型進行解碼,從唇語文本數(shù)據(jù)到唇語語言模型進一步獲取發(fā)音單元,最終輸出文字。
據(jù)了解,搜狗在非特定人開放口語測試集上,即搜狗唇語識別系統(tǒng)的通用識別的準確率在60%以上,超過google發(fā)布的英文唇語系統(tǒng)50%以上的準確率;而在垂直場景下,如車載、智能家居等場景下已經(jīng)達到90%的準確率。
出門問問:推出全球首款無線智能音箱Tichome Mini
11月,出門問問正式面向國內市場發(fā)布全球首款便攜防水的無線智能音箱——小問音Tichome Mini。
據(jù)了解,Tichome Mini可以滿足用戶的多場景移動需求,已實現(xiàn)語音控制40多個品類,上千款智能家電設備,具備兒童內容、音樂電臺、智能家居、時間管理、新聞資訊、運動助理、生活服務、實用工具等多種功能,可以隨時隨地跟它智能語音交互。
云知聲:推出“Pandora”語音中控方案
6月,云知聲發(fā)布了最新產品“Pandora”語音中控方案。據(jù)了解,打造這款類似Amazon Echo的智能中控和音箱類產品是復雜的過程,中間涉及語音識別、語音喚醒、語義理解、用戶畫像、聲學等綜合技術,同時,聲學、結構、麥克風陣列等因素又互相關聯(lián)互相影響。復雜的AI技術元素和環(huán)節(jié)讓大部分智能中控的產品化之路止步不前。
而“Pandora”將遠場語音識別、語義理解等復雜的AI技術元素整合為一個整體方案?蓭椭蛻魧崿F(xiàn)6個月快速集成,量產出貨,為產品智能化落地加速。
小米:“小愛同學”成史上被點名最多的同學
12月,小米AI音箱“小愛同學”最新使用次數(shù)達到102946421次,音頻播放總次數(shù)158673818次,這個數(shù)據(jù)在同行大幅領先,成為史上被點名最多的同學。
據(jù)了解,“小愛同學”能播放音樂、電臺點播、相聲、小說、脫口秀、教育學習等多種有聲讀物。除此之外,還能提供新聞、天氣、鬧鐘、倒計時、備忘、提醒、時間、匯率、股票、限行、算數(shù)、百科/問答、閑聊、笑話、菜譜、翻譯等各類交互功能。
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
-
即日-10.29立即報名>> 2024德州儀器嵌入式技術創(chuàng)新發(fā)展研討會
-
10月31日立即下載>> 【限時免費下載】TE暖通空調系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報名>>> 【在線會議】多物理場仿真助跑新能源汽車
-
11月14日立即報名>> 2024工程師系列—工業(yè)電子技術在線會議
-
12月19日立即報名>> 【線下會議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產業(yè)大會
-
即日-12.26火熱報名中>> OFweek2024中國智造CIO在線峰會
推薦專題
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結構工程師 廣東省/深圳市