訂閱
糾錯
加入自媒體

美國高通公司劉學(xué)徽:Qualcomm驍龍移動平臺加速終端側(cè)AI

8月30-31日,由中國高科技行業(yè)門戶OFweek維科網(wǎng)、高科會主辦,OFweek人工智能網(wǎng)承辦的2018中國(上海)國際人工智能展覽會暨OFweek(第二屆)人工智能產(chǎn)業(yè)大會在上海成功舉辦。本次大會用全新視角透析行業(yè)動態(tài),解讀人工智能領(lǐng)域本年度海內(nèi)外最值得關(guān)注的學(xué)術(shù)與研發(fā)進(jìn)展,與數(shù)千位人工智能領(lǐng)域的國際知名企業(yè)高層、行業(yè)資深專家、專家分析機(jī)構(gòu)等數(shù)千位精英進(jìn)行多方分析與探討。

在30日AI技術(shù)專場主論壇上,美國高通公司劉學(xué)徽發(fā)表了《Qualcomm驍龍移動平臺加速終端側(cè)AI》主題演講,他分析了端側(cè)人工智能的四大需求、智能手機(jī)上人工智能的三個方向和基準(zhǔn)測試的四個組成。不僅如此,劉學(xué)徽還強(qiáng)調(diào)人工智能向終端測的發(fā)展,需要依靠用戶和設(shè)備使得人工智能受到訓(xùn)練、執(zhí)行和推理。智能手機(jī)AI體驗不能只依靠一個內(nèi)核,在AI面向圖像分類網(wǎng)絡(luò)時,其準(zhǔn)確率與運算次數(shù)的對比是基準(zhǔn)測試最重要的指標(biāo),人工智能軟件持續(xù)優(yōu)化,是實現(xiàn)驍龍SoC產(chǎn)品組合性能能在一年內(nèi)實現(xiàn)兩倍提升的重要突破點。

美國高通公司產(chǎn)品經(jīng)理劉學(xué)徽

以下是美國高通公司產(chǎn)品經(jīng)理劉學(xué)徽的現(xiàn)場演講內(nèi)容,OFweek小編作了不改變原意的整理和編輯:

各位嘉賓,大家上午好,非常高興有這個機(jī)會跟大家來分享一下高通在人工智能方面所做的一些成績。今天我的演講題目實際上沒有咱們宣傳的這么大,我的演講因為時間原因只有20分鐘,所以我們把主題鎖定在高通的終端側(cè)人工智能方面所做的一些事情。

高通實際上是做終端芯片,包括智能手機(jī)芯片、平板電腦芯片,還包括物聯(lián)網(wǎng)芯片,我們公司有兩大戰(zhàn)略,一個是人工智能,也就是契合今天的主題,另外一個戰(zhàn)略就是5G,未來幾年是5G的時代,這兩個技術(shù)實際上在“萬物互聯(lián)”物聯(lián)網(wǎng)飛速發(fā)展的時代是可以非常好的契合在一起的。端側(cè)人工智能的產(chǎn)生在這幾年是非常的火,這個話題也非常的火,它的產(chǎn)生實際上是有它的需求的。

我們總結(jié)下來它主要有這么幾大需求。

首先第一個端側(cè),因為大多數(shù)的終端都是人在使用,它的隱私性,用戶的隱私保護(hù)是一個非常強(qiáng)的需求,在端測用人工智能處理而不是交給云來做,可以滿足隱私性的需求。

第二個就是可靠性,大家可以想象一下,我們在自動駕駛汽車的時候,如果說AI的能力不是在車上來完成的,而是交由云來完成,萬一通訊上出現(xiàn)問題,任何的延時性、可靠性,包括低延時都滿足不了,那帶來的后果是非常嚴(yán)重的。

另外就是高效,這里講的高效,實際上除了運算對算力資源消耗的高效之外,還有一個非常重要的,就是對能耗的消耗,也就是咱們終端設(shè)備對電池的使用,這也是非常重要的一個因素。

最后一點就是個性化,因為咱們很多IOT的設(shè)備,不管是手表也好,可穿戴設(shè)備也好,尤其是我們的手機(jī),雖然用的是同一款手機(jī),但是不同的人用的時候都希望有符合自己使用習(xí)慣的一些AI的功能,這些需求就推動了端側(cè)人工智能的快速發(fā)展。

雖然今天咱們主題是談的機(jī)器人,物聯(lián)網(wǎng),但是不得不談一下智能手機(jī),因為智能手機(jī)是目前在咱們地球上唯一單品出貨量最大的,我們有一個第三方的預(yù)測,就是2018年到2022年五年的時間,新出貨的手機(jī)會達(dá)到86億臺,大家可以想象一下,這86億臺有相當(dāng)大的比例會是搭載了人工智能的手機(jī),咱們聚焦一下,以智能手機(jī)作為一個例子,人工智能的功能能夠給用戶帶來哪些很好的體驗?

人工智能在智能手機(jī)上有三個方向。

第一個是拍照。也就是跟視覺密切相關(guān)的一大方向,這個領(lǐng)域有很多功能已經(jīng)都商用了,比如說采用人工智能技術(shù)的美拍自拍,然后包括背景虛化等等一些功能,這都是人工智能在拍照方面、視覺方面的一個應(yīng)用。

第二個方向是語音。語音的UI包括語音的喚醒,甚至包括這種同聲傳譯等等,這些都是語音方面一個大的應(yīng)用領(lǐng)域,目前在手機(jī)方面語音還是剛剛起步。

第三個方向是增強(qiáng)現(xiàn)實,也就是大家常說的AR。也就是說用戶可以拿著手機(jī),對一些實景做拍攝的時候,在屏幕上疊加虛擬的圖像或者虛擬的景象,給用戶帶來全新的一種體驗,它后面的商機(jī)也是非常大的,可以產(chǎn)生新的游戲玩法,大家也都知道游戲產(chǎn)業(yè)是很大的一個產(chǎn)業(yè)。同時還有很多的商業(yè)的一些導(dǎo)入,比如說廣告,包括一些互動的交流,可以帶來很多的一線體驗。

稍微回顧一下高通在端測人工智能的一個發(fā)展,實際上高通從2008年就開始在研究神經(jīng)元處理單元在芯片上的一個落地,到了2015年我們第一代的人工智能產(chǎn)品問世,并且在我們當(dāng)時的旗艦級芯片—驍龍820上落地,實際上當(dāng)時做的是針對卡費這個網(wǎng)絡(luò)模型的一個加速,讓它在cpu上做加速。我們的第二代AI產(chǎn)品實際上是2016年—2017年這兩個年度在旗艦機(jī)835芯片做的一個落地,我們是支持更多的框架,然后是讓神經(jīng)元網(wǎng)絡(luò)可以通過我們的一個引擎,我們叫“SNPE”,通過這個引擎在CPU、 GPU 、DSP上做加速。

再看今天我們的第三代,也就是在現(xiàn)在很多高端旗艦機(jī)的845芯片上落地的,我們實際上做到了更多框架的支持,有很多流行的新的框架,甚至包括我們國內(nèi)的百度的PAD PAD,還有商湯的power框架的支持,我們的引擎做了更多的擴(kuò)展,支持了一些新的API,就是我們高通AI的一個產(chǎn)品,這個產(chǎn)品實際上融合了硬件,包括大家看到DSP、GPU、CPU三種核,包括了我們的一系列的軟件工具,還包括了對多種框架、多種API的支持,所有的這些融合成我們的AI產(chǎn)品,所以我們的AI產(chǎn)品實際上是一種分布式運算的AI技術(shù)。當(dāng)然除了我們這樣的一個AI產(chǎn)品之外,如果沒有算法廠家,沒有一些系統(tǒng)集成商是最終落不到這個終端設(shè)備上來的,所以我們非常重視對這個生態(tài)系統(tǒng)的一個建設(shè)。所以我們就提出一個觀點,我們的觀點是在智能AI手機(jī)上,它的體驗實際上靠一個核是不夠的,也就是大家可能看到這個AI領(lǐng)域里有一些爭論,比如有一種說法叫做你沒有NPU、沒有專門的AI的核,就不叫AI手機(jī),我們是非常不同意這種觀點的,我們的觀點是只要是AI的功能在這個終端上實現(xiàn)了,那它就是一個AI手機(jī),后面我會展開跟大家來談?wù)勥@個問題,所以就談到了另外一個話題,就是你怎么來評判這個設(shè)備的AI的能力,這就是一個AI的基準(zhǔn)測試。

我們覺得基準(zhǔn)測試實際上應(yīng)該由四個方面組成。

第一個方面首先是準(zhǔn)確率,不管是用AI的視覺來做照片的分類也好、物體的識別也好,它的準(zhǔn)確率是第一位的,沒有準(zhǔn)確率就沒有好的用戶體驗。

第二個是性能,就是所謂的跑分或者是速度,當(dāng)然這個性能是非常重要的,有好的性能才能承載更多的更強(qiáng)的AI的算法。

第三個是能效,因為咱們談的是端側(cè)的AI,所以對電池的使用,尤其是怎么省電,這個是一個非常重要的指標(biāo),不得不考慮,因為如果在云端,你的電可以是無限的,但是在終端上這個能效是必須要考量的一個指標(biāo)。

第四個也是最重要的就是用例,我們今天在端上做AI實際上最終的目的就是要在端上實現(xiàn)AI的功能,給用戶帶來不同的更好的體驗,所以沒有用例支撐的測試實際上是沒有意義的。再展開來談,就是實際上大家業(yè)內(nèi)來做測試的時候,無非都是用一些最經(jīng)典的流行的網(wǎng)絡(luò)來做這個測試,哪些網(wǎng)絡(luò)能夠符合前面我們講的這四種指標(biāo)呢?我們列下來了一些常用的最流行的一些網(wǎng)絡(luò)。

大家看到我們畫了一條曲線,曲線上縱坐標(biāo)是準(zhǔn)確率,橫坐標(biāo)是對算力的一個需求。大家看到曲線左上角的這幾個網(wǎng)絡(luò),這兩個網(wǎng)絡(luò)是我們覺得在手機(jī)這樣的手持設(shè)備上最有用的、最經(jīng)常會用到的網(wǎng)絡(luò),這兩個網(wǎng)絡(luò)目前可以達(dá)到高效以及能效各方面的滿足。對比下來大家看到這個右邊的VGG-16以及VGG-19,我們覺得這兩個網(wǎng)絡(luò)實際上對智能手機(jī)來講是沒有用的,在用例方面是沒有用的,因為它的一個準(zhǔn)確率,另外一個尤其是功耗的需求太高了,不適合在手機(jī)上,所以我們在做優(yōu)化的時候,基本上是放棄這個VGG-16以及VGG-19的一個支持,然后在ResNet50以及inception-v3這兩個網(wǎng)絡(luò)上面做了很多的優(yōu)化。這就是印證了我們前面提出的四個觀點,同時也印證了為什么我們覺得分布式的運算不是靠一個單核的NPU來運算。另外除了核能力的一個提升之外,還有一點非常重要,就是整個在端測AI的軟件方面的提升。有一個數(shù)據(jù),就是一年的時間硬件沒有任何的變動,但是軟件做了提升之后,整個的性能翻了一倍。

所以到現(xiàn)在為止,前面講過,我們非常重視生態(tài)系統(tǒng)的建設(shè),以上所有這些性能已經(jīng)在各位拿的手機(jī)上商用了,實際上這些算法都不是高通公司做的,是仰賴我們的合作伙伴,包括我們列下來這些合作伙伴,當(dāng)然還有一些沒有在列下來的合作伙伴,他們來完成的,當(dāng)然他們的算法在我們的平臺也上做了很好的優(yōu)化。除了跟算法廠家合作之外,我們跟云合作伙伴,也就是大家俗稱的互聯(lián)網(wǎng)公司也有一些深度的合作。在國內(nèi)我們跟騰訊做了一個非常接地氣的一個應(yīng)用,大家手機(jī)上的qq最新版本里,如果你的手機(jī)支持我們的AI產(chǎn)品用的這個芯片的話,你就可以找到一個叫做高能舞室的一個功能,如果不是的話這個功能出不來,它這個功能是什么?它就是出一些圖標(biāo)教你怎么去跳舞,然后給你打分,它用到了肢體識別的一個算法,這個已經(jīng)商用,大家如果有興趣的話可以在qq找到這個功能。我們跟百度在語音方面有一些深度的合作,當(dāng)然在國際上跟Facebook在AR方面,跟谷歌在圖相冊的一些分類方面,包括跟微軟開放的AI的API這個方面都有一些深度的合作。

最后總結(jié)一下,實際上高通的整個的AI的產(chǎn)品戰(zhàn)略,就是我們以我們芯片為一個基點,以開放的心態(tài)支持多種框架,并且支持除了安卓之外,還有windows這樣的一些操作系統(tǒng),同時緊密的跟領(lǐng)先的算法廠家,包括今天曠世謝總這樣的合作伙伴做緊密的合作,然后產(chǎn)生出一些很好用戶體驗的特性,創(chuàng)造出一些應(yīng)用,最后落地到各種終端上,為產(chǎn)業(yè)為用戶帶來更好的一些體驗和價值。我的演講分享到這,謝謝大家。

聲明: 本網(wǎng)站所刊載信息,不代表OFweek觀點。刊用本站稿件,務(wù)經(jīng)書面授權(quán)。未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制、翻譯及建立鏡像,違者將依法追究法律責(zé)任。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標(biāo)題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號