北京曠視科技有限公司副總裁謝億楠:中國人工智能的系統(tǒng)與準(zhǔn)繩
8月30-31日,由中國高科技行業(yè)門戶OFweek維科網(wǎng)、高科會主辦,OFweek人工智能網(wǎng)承辦的2018中國(上海)國際人工智能展覽會暨OFweek(第二屆)人工智能產(chǎn)業(yè)大會在上海成功舉辦。本次大會用全新視角透析行業(yè)動態(tài),解讀人工智能領(lǐng)域本年度海內(nèi)外最值得關(guān)注的學(xué)術(shù)與研發(fā)進(jìn)展,與數(shù)千位人工智能領(lǐng)域的國際知名企業(yè)高層、行業(yè)資深專家、專家分析機(jī)構(gòu)等數(shù)千位精英進(jìn)行多方分析與探討。
在30日AI技術(shù)專場主論壇上,北京曠視科技有限公司副總裁謝億楠為現(xiàn)場觀眾帶來了《中國人工智能的系統(tǒng)與準(zhǔn)繩》主題演講,分享了AI企業(yè)核心資源如何與核心生態(tài)系統(tǒng)打通、AI技術(shù)、產(chǎn)業(yè)升級等方面的解決方法,另外副總裁謝億楠從四個方面分析了人工智能的落地與應(yīng)用,還表示在目前人工智能產(chǎn)業(yè)化領(lǐng)域,AI技術(shù)在一年、三年、五年可以實現(xiàn)爆發(fā)增長。
北京曠視科技有限公司副總裁謝億楠
另外副總裁謝億楠從四個方面分析了人工智能的落地與應(yīng)用,還表示在目前人工智能產(chǎn)業(yè)化領(lǐng)域,AI技術(shù)在一年、三年、五年可以實現(xiàn)爆發(fā)增長。
以下為北京曠視科技有限公司副總裁謝億楠的現(xiàn)場演講內(nèi)容,OFweek人工智能網(wǎng)作了不改變原意的整理和編輯:
先感謝一下主辦方,我后面大概說一個點(diǎn),就我們現(xiàn)在看著人工智能公司企業(yè),我們到底應(yīng)該用哪些標(biāo)準(zhǔn)和準(zhǔn)繩去衡量一家公司對于AI的理解,AI和產(chǎn)業(yè)不是說我做AI那就是AI產(chǎn)業(yè),而是有一定的要求。
第一點(diǎn)我們?nèi)ツ耆ヤ浺粋節(jié)目,當(dāng)時導(dǎo)演提出來讓我們做人臉識別,底下編導(dǎo)說人臉識別我也很厲害,我把你這個機(jī)器打敗了怎么辦?所以我上來第一點(diǎn)放了幾組照片,當(dāng)時一共是40個,沒找太多,我說那這樣咱們做一下試試,當(dāng)時編導(dǎo)那個組花了大概十分鐘左右做了一下,很簡單兩個照片,看是不是一個人,這個測試跟現(xiàn)在非常有名IFW很像。
試一下人和機(jī)器到底有多少差別?40道題,他們對了20道,有的上下兩張照片都是一個人,只是做了一些美顏,這幾張照片機(jī)器都給出了很肯定的答案,就是一個人,但人都會花了很長時間來去判斷他到底是不是一個人,他們甚至當(dāng)時問了旁邊的中國最強(qiáng)大腦,他說看人臉不要看臉看耳朵,給了他們很多這種所謂的印記,給了很多提示,做到最后還是錯了一半,所以我第一句話講為什么中國這人工智能做產(chǎn)業(yè)是因為它的準(zhǔn)確率和很多應(yīng)用場景確實比人要高效,高效不僅僅是提升在準(zhǔn)確度上,還提升在速度上面,當(dāng)時機(jī)器做用了大概不到一秒,人大概做了半個小時,中間因為有些人自認(rèn)為自己識別對了,他覺得要堅持,所以最后還出現(xiàn)內(nèi)訌。
大家講人工智能技術(shù)很厲害,那我們到底應(yīng)該怎么樣去判斷一家人工智能企業(yè)它很厲害?我們現(xiàn)在可以看到中國人工智能產(chǎn)業(yè)公司會催生一個新的產(chǎn)業(yè),叫數(shù)據(jù)標(biāo)注行業(yè)。我給大家還原一下整個人工智能的工作原理,其實人工智能和我們?nèi)祟惖膶W(xué)習(xí)很像,都是通過經(jīng)驗值去學(xué)習(xí)的,機(jī)器對于經(jīng)驗的這件事叫數(shù)據(jù)。
那數(shù)據(jù)來講的話是什么意思?比如說你給100萬張照片,告訴它這里面這些人是男的,這些人是女的,這些人是小孩,給完之后,你把它標(biāo)好了,機(jī)器自己學(xué)完之后,還可以舉一反三,那人做這件事情的話會很快,一個小孩可能看了幾個人臉,就大概知道男人長什么樣,女人長什么樣,孩子長什么樣,老人長什么樣,不用看到一件事情就教給他,機(jī)器不行,機(jī)器需要成千上萬張不斷的去訓(xùn)練它,它才能去做出來,所以中國這個圈里面有一句話叫有多少人工就有多少智能。
一個人工智能如果是想做產(chǎn)業(yè)的,要解決第一件事情的話就要去人力化。我們之前看到所有人工智能叫大規(guī)模監(jiān)督性學(xué)習(xí),但是一家人工智能公司想做到產(chǎn)業(yè)里面,它要解決的問題不僅僅是剛才所看到那件事,兩個人是不是一個人這么簡單的命題,而是在里面有很多很細(xì)小的問題。
我舉個例子,比如說我們提供門口迎賓的簡單的一個系統(tǒng),就這么一個簡單系統(tǒng),有多少個場景需要被它識別,第一個叫逆光,就是說場景后面是個白光,是個門口,在門口情況下,大家拍照都會發(fā)現(xiàn)一個問題,在那個情況下拍照人臉上是發(fā)黑看不見的,這個時候人眼會自動會調(diào)節(jié)自己的進(jìn)光量,會把焦點(diǎn)對在人上面,但是機(jī)器不會,因為你有的時候去做迎賓場景是在室外,有的時候在室內(nèi),你要給它一個很通用性的東西,所以在每一個小的產(chǎn)業(yè)應(yīng)用里面都要去用這個東西,它要回到一個原點(diǎn)叫時間成本。意思就是人工智能如果想用到產(chǎn)業(yè)里面,你要解決很多很場景化的問題,就要去給很多很場景化的數(shù)據(jù),收集一個場景話數(shù)據(jù)大概需要2到3周,再去訓(xùn)練可能需要一個月能解決,這一個月時間,機(jī)器可能只能解決一個小問題。我們?nèi)绻軌虬堰@件事情通過非常小的場景就會識別的話,那就可以去做。所以我們現(xiàn)在去看一個公司產(chǎn)生算法或者產(chǎn)生功能性算法,或者說它可以把一個算法定制性的放到各種端上,可以放到各種產(chǎn)品里的話,那這就能夠告訴他,他的人工智能技術(shù)是去人力化的。
我舉個例子,我們之前去公安做一個案子,當(dāng)時警方給我們的所有的視頻都是非常粗糙的,粗糙到像素化,那臉上不是說是一個人臉,是一個格一個格,讓你識別這個東西,這個東西到人是無法識別的,那怎么辦?正常情況下趕緊去采集所有樣本的東西,采完之后回來改,當(dāng)時給我們的時間是兩天,所有企業(yè)都蒙了,我們當(dāng)時花了大概一天左右時間把這個東西搞定了。在整個過程中,對于數(shù)據(jù)的處理,在現(xiàn)在所有的人工智能科學(xué)家里面,我們可以講有五成以上的人,其實并沒有跟做算法相關(guān)的本質(zhì)性工作而做數(shù)據(jù)清理,包括那些大牛。如果我們能夠把它們真正解放出來,讓它的算法能夠真正地跑起來,我覺得這個東西是對于我們來講就不一樣了,我們的整個研究人員平均年齡大概23歲,他們都是用很通用的方法,他們這種很聰明的孩子,不需要太多的經(jīng)驗性的東西去解決問題,我們就可以直接去做,他們這兩天可能要去打一個比賽,現(xiàn)在給我的結(jié)果是表現(xiàn)還不錯,那同樣也是用這套東西,如果一家公司做人工智能產(chǎn)業(yè)型公司,且只會打比賽那是不行的, 人工智能技術(shù)問題是要解決的。
第一件是從0到1的話,你要去解決它本質(zhì)問題。你要解決掙錢這件事情,怎么掙錢?人工智能只是一個工具,你得想這個東西能用在什么地方,所以曠世在2014年解決的第一個是人臉驗證、線上實名驗證這件事情。你在這里面的話,其實它并沒有本質(zhì)性的對一個行業(yè)進(jìn)行改變,但是是一個最大的催化劑,風(fēng)控最前端叫什么?叫用戶的一個開戶動作。
如果沒有自己的網(wǎng)點(diǎn),那它就會想怎么樣能夠通過手機(jī)在沒有網(wǎng)點(diǎn)的情況下,保證我注冊進(jìn)來的每一個人都是和他身份證上一模一樣的人。這個就是一個命題、一個場景,那你的技術(shù)能不能夠解決這個場景的問題,就是一家人工智能產(chǎn)業(yè)公司所要去思考的問題,而不是說我只解決到一個人臉識別做到99.999%,跟千足金一樣,這個其實是沒有意義的。當(dāng)時我們做第一個是支付寶,支付寶給我們第一個命題是20萬樣本,之前我們做FW里邊樣本多少?6000對,91.5%的東西和換到20萬里面的話,你會發(fā)現(xiàn)你乘完之后還有很多是錯誤的,這樣是不允許的。
所以要想到在真正產(chǎn)業(yè)及公司里面,要從0到1談這件事情的話,想的東西、面對的東西、解決的問題就已經(jīng)不再是幾千對這樣的事情了,而是要為全中國幾億人去做刷臉驗證的時候都不能錯。我們現(xiàn)在會看到肯德基上線了很多人臉識別的支付,那里面其實是曠世的face ID的算法,我們第一個場景或者說人工智能產(chǎn)業(yè)公司第一個解決就是看做的東西是不是解決了行業(yè)里面的本質(zhì)痛點(diǎn),還是說它只是解決了一個小工具,讓你覺得好玩,曠世之前做的也是工具,比如曠世最早的產(chǎn)品是叫《烏鴉來了》,我用人臉控制一個人去左右搖擺,就這件事情來講可以不用人臉,但開戶這件事情,可不可以不用人臉?它也可以,但它的風(fēng)控成本就會高很多,因為它連第一件事,連保證我本人注冊的時候,是不是我本人都做不到。
第二件事情的話叫雙閉環(huán)發(fā)展,其實我們看到faceID當(dāng)時滴蘋果提出來,但是faceID.com是曠世注冊的一個域名,當(dāng)時我們也得益于蘋果的這次傳播,讓我們的流量大概提升了大概十倍左右。第一圈轉(zhuǎn)的話,會發(fā)現(xiàn)你解決的問題是face,第二圈解決問題是ID,因為你如果只解決了face件事情的話,到了兩年之后會有十個人跟你能做同樣的事情,我舉個例子,比如現(xiàn)在所有做語音識別里面企業(yè)之前做都是付費(fèi)的,現(xiàn)在免費(fèi)的進(jìn)來了,如果你還是一個工具,你會發(fā)現(xiàn)你的模式基本就會被免費(fèi)模式所取代,所以你要做第二圈是什么?你要解決這ID的問題,也就是說我們現(xiàn)在給很多企業(yè)做的東西,并不一定是說我要告訴你這人臉是不是一個人,更多的是要告訴你一個計劃,這個人上個月已經(jīng)在其他平臺注冊過四次了,我不關(guān)注你是誰,但是我告訴你這么一個信息,因為我們是一個平臺,所以這個信息對他來講就非常重要,雖然這個照片和身份證是一個人,但由于它多次驗證,說明有很高的欺詐風(fēng)險。
當(dāng)你選擇一個場景的時候,你要去想到這個場景是不是有壁壘,還是說之后你只能去解決一個工具性的問題,那如果是的話,你會發(fā)現(xiàn)未來一定會有很多大廠去做這件事情。比如說曠世在2012年做的face佳佳,那個產(chǎn)品16年的時候百度騰訊全部都做了,全部都開放了,如果我們還堅持那個場景的話,我們基本就被打趴下了,因為他們可以完全不要錢。一個產(chǎn)業(yè)級公司要去解決一個核心問題,并且在這個問題上能夠找到一個足夠高的門檻,或者說能夠通過時間能夠建筑的成本。
第三件事的話叫產(chǎn)業(yè)賦能,直接看到經(jīng)常會講的智慧城市。我先講一個網(wǎng)紅的故事,這是我們實際中在城市里面幫城市管理者提供的一個案例,當(dāng)時紅圈的這個人是一個在逃犯,我把在逃犯界里的這個網(wǎng)紅拿出來給大家做一個對比,什么叫產(chǎn)業(yè)生態(tài)打通和生態(tài)沒打通,這個網(wǎng)紅是誰呢?是張學(xué)友,因為張學(xué)友演唱會現(xiàn)在已經(jīng)抓了五個人了,所有感覺是有問題的人都愛去張學(xué)友演唱會上,但是張學(xué)友演唱會它并不是生態(tài)打通的一個場景,它其實還只是我剛才提到的第一點(diǎn),它只從0到1了,為什么?我還原一下當(dāng)時的場景,就是一個小桌子、一個筆記本、一個攝像頭,然后一個工作人員坐在這邊盯著桌子,一個人一個人進(jìn)來看,他就會做比對,有報警,報警一分鐘會報三四個,因為這系統(tǒng)不是很好,筆記本做這個實驗,所以它就會挨個把照片發(fā)給當(dāng)?shù)氐拿窬f張隊長,我發(fā)現(xiàn)了一個報警,您處理一下,這個隊長一個演唱會下來可能會收到三四十個報警,他把三四十個發(fā)到指揮中心也叫研判室。
研判室告訴他這一個人是有問題的。這個時間大概過去多少,過去一個小時了。然后一個小時之后,張隊長拿了一個消息給當(dāng)?shù)厮械墓玻f之前在哪個口進(jìn)來一個人穿著什么樣,所有的民警注意了,我們要對這個人進(jìn)行勘址,這些人就在場地里開始游蕩,整個結(jié)束之后可能鎖定了幾個人,出來就摁倒,為什么演唱會能抓?因為演唱會是在里面一蹲蹲兩個小時的,這兩個小時就足夠的處理了。所以只有演唱會的場景是能夠做這件事情,這就是生態(tài)沒打通的,在這個過程中它并沒有幫這個行業(yè)解決降本增效的問題,中間還需要大量人力去處理它,還需要大量時間去做這件事情,它做這些事情來講的話,只解決了一件事情,就是提示我這有問題,然后解決問題的時候一幫人去做。
所以生態(tài)打通的環(huán)境是一個什么場景?我同樣用那個方案去舉個例子,當(dāng)時是在地鐵里面,也是在華東區(qū),當(dāng)時場景是什么樣?地鐵站兩分鐘時間,從進(jìn)站第一秒開始到他走,當(dāng)?shù)氐某鞘泄芾碚吒嬖V給我們的時間是兩分鐘,為什么是兩分鐘?因為他進(jìn)站之后兩分鐘之內(nèi)你不做處置就走了。所以兩分鐘之內(nèi)的話是要從端到端的,也就是我們前端的攝像頭,你要在那邊就直接做視頻處理了。要把算法先塞到那里面,不能做運(yùn)算,只能做去檢測,當(dāng)?shù)氐囊粋筆記本就在做運(yùn)算,做完運(yùn)算之后自動傳到研判中心,研判中心拿了結(jié)果之后直接就處置,之后直接給一個結(jié)果回到這個站點(diǎn),這個站點(diǎn)之后直接給到這個地點(diǎn),最近的那個站,它會給到一個什么信息?給的信息就是你現(xiàn)在去3號站臺8號車廂門口去關(guān)注一個穿藍(lán)色襯衫的男人,東亞男性,那這個過程中的話大概一分半左右,這就是一個生態(tài)打通的過程。
所以說算法從剛開始第一個攝像頭開始到中間的計算端到指揮中心里面,研判室里面的解決方案,到最后警務(wù)站,最后的警示警務(wù)終端整個是連通的。數(shù)據(jù)流完之后,我們講到一個產(chǎn)業(yè)級的AI公司并不解決一個問題,它不是一個工具,他要解決一個行業(yè)真正創(chuàng)新就是兩個字,一個叫降本,一個叫增效。
去年曠世在全國為中國的城市管理者破了大概5000多個案子,一個案件的抓包成本大概30萬左右,一個抓逃,對于整個的團(tuán)隊來講是一個集體二等功,這是真正對一個行業(yè)有用的,或者說你在行業(yè)中能夠生存下去的AI產(chǎn)業(yè)公司,就是你能夠為它產(chǎn)生極致的降溫和機(jī)制增效。
對于一個產(chǎn)業(yè)的東西,我們之前看到整個城市都在應(yīng)用人臉識別技術(shù),在十年之前就用了。為什么現(xiàn)在都沒有去落地去鋪開,是因為它沒有解決增效的問題,我還需要同樣警力去解決同樣的事情,你只給我了一個報警,這個人在哪我不知道。電影里面最新的電影,叫《我不是藥神》,其中有一段人家已經(jīng)發(fā)現(xiàn)監(jiān)控照片了,但是現(xiàn)場的刑警還是表示我需要一周才能抓到,且要動用全局的警力才能做到這一點(diǎn)。這就是我們看到的一個現(xiàn)狀,你的AI產(chǎn)業(yè)級的產(chǎn)品是不是一個產(chǎn)級產(chǎn)品,就是說你能不能夠通過用最小的人力,用最高的技術(shù)去解決這個問題。
第四個叫升級,我同樣用一個比較火的事去講這件事情,這叫什么?這是零售,這個例子就在杭州,我們在跟鮮生活做的一個產(chǎn)品實驗店,在這里面的話,大家會看到一年之前叫無人店,刷臉進(jìn)門刷臉支付,你只要做到這列就可以是無人店了,還有一個就是叫掃二維碼買東西。這個過程中大家會看到,其實對于零售店里面沒有做到本質(zhì)性的改變,零售店的本質(zhì)改變是什么?它評效、人效、選品是不是最優(yōu)的一個狀態(tài)?
我們舉個例子,什么叫平效、人效最優(yōu)?日本的三米萊文和中國的全家在毛利率這一個指標(biāo)上大概差了一個數(shù)量級。差的是這個店長對于這個店到底該賣給什么樣的人,我這個店來的是什么樣的人,有沒有很深刻的理解?如果你有很深刻的理解的話,會發(fā)現(xiàn)一個點(diǎn),為什么有的店衣服賣得好?是因為店長知道進(jìn)什么樣的衣服,他知道應(yīng)該擺在什么樣的位置,他知道應(yīng)該怎么給店員培訓(xùn),我應(yīng)該怎么去介紹。這個過程就是目前零售店最缺的一個過程,就是能夠去把它真正的數(shù)據(jù)化,然后再智能化。賣什么東西?給誰賣東西?賣什么東西掙錢?這就是我們現(xiàn)在看到新零售所想解決的最大的問題,所以之前我們看到很多新零售解決說現(xiàn)在可以去測算人流,可以刷臉支付,可以刷臉進(jìn)門,刷了進(jìn)門之后甚至?xí)愕男庞觅~戶綁定,我們看到這些東西很多,對產(chǎn)業(yè)有沒有升級,我們就還是問一句話,你對一個單店的成本有沒有改變?比如說你現(xiàn)在把它做一套升級改變,它不用你,只有一個原因,就是你對它的升級改變之后,它所帶來的毛利提升在三年之內(nèi)超不過所在這邊花的成本,他就不會去做這件事情。
作為一個AI企業(yè),如果真正要走到行業(yè)里面,我們經(jīng)常會聽到AI+XX行業(yè),你走到這個行業(yè)里面,它用你,你必須解決問題,也就是我用了你之后,你能不能為我多賺錢或者極致性的賺錢。比如我們會看到為什么現(xiàn)在整個資本市場里零售企業(yè)和傳統(tǒng)的物流企業(yè)沒有上市企業(yè),或者上市機(jī)會非常少,是因為他們本身都是毛利非常低的一個行業(yè),而這里面的成本非常高。所以AI要進(jìn)去這里面的話,真正要解決就是要去解決在這里面的成本和效率的問題。
所以我們真正看AI加到行業(yè)里面,真正要去想的,其實不光是技術(shù)能解決什么問題,還有一個就是場景接不接受,為什么?自動駕駛我們可能放到5年會成熟,是因為技術(shù)本身可能已經(jīng)成熟,但是我們又問一個問題,當(dāng)時這個問題是在一個采訪上問馬斯克,他們說馬斯克先生您好,您已經(jīng)這么篤定說您現(xiàn)在這個技術(shù)這么好了,那您敢不敢每天閉著眼睛坐上車,一睜眼就到公司,在這個過程中不睜開眼睛,就任憑汽車帶你走,他想了兩分鐘說他不敢。所以我們就會想一個技術(shù)到場景里面適不適應(yīng)被場景技術(shù)所改造,它是有一個時間度的。
假設(shè)說人工智能已經(jīng)滿足自動駕駛了,但是沒有哪個公司老板說我敢天天就根本就不用管,也別給我坐人,我就坐我自己車?yán)锩,人工智能帶我走,所以我們真正要講的是一個技術(shù),就是說真正要做產(chǎn)業(yè)化,要去看第一基礎(chǔ)有沒有解決問題,同樣還要看這個場景是不是能夠真正的去適應(yīng)你的發(fā)展。
其實今天的這個主題也是以人工智能和產(chǎn)業(yè)很相關(guān),最后我們安靜在這個頁紙,最后再次感謝這個主辦方的邀請,謝謝大家!
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 Intel宣布40年來最重大轉(zhuǎn)型:年底前裁員15000人、拋掉2/3房產(chǎn)
- 2 因美封殺TikTok,字節(jié)股價骨折!估值僅Meta1/5
- 3 宏山激光重磅發(fā)布行業(yè)解決方案,助力智能制造產(chǎn)業(yè)新飛躍
- 4 國產(chǎn)AI芯片公司破產(chǎn)!白菜價拍賣
- 5 具身智能火了,但規(guī)模落地還需時間
- 6 國產(chǎn)英偉達(dá)們,抓緊沖刺A股
- 7 三次錯失風(fēng)口!OpenAI前員工殺回AI編程賽道,老東家捧金相助
- 8 英特爾賦能智慧醫(yī)療,共創(chuàng)數(shù)字化未來
- 9 英偉達(dá)的麻煩在后頭?
- 10 將“網(wǎng)紅”變成“商品”,AI“爆改”實力拉滿
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市