訂閱
糾錯
加入自媒體

你在淘寶上看到的圖片和視頻 到底怎樣一步步被AI接管?

2018-04-24 10:19
來源: 極客公園

在讓AI協(xié)助人類的這條路上,阿里帶來了“魯班”和Aliwood兩套AI工具,它們將成為淘寶店家日后的重要利器。

給你一秒鐘,你能設(shè)計出8000張海報嗎?

不要那種粗制濫造的效果,而是能掛在雙十一淘寶網(wǎng)站,被上億人看到的那種,帶有獨特設(shè)計風(fēng)格的作品,你能做到嗎?

不開玩笑,即便效率最高的設(shè)計師,也只能說這是Mission Impossible,但一位2015年入職阿里巴巴的新員工魯班,只用了兩年多時間,就達到了這個效率,而且到今年雙11時,它將很可能成為具有阿里巴巴P6設(shè)計師水平的員工。這是什么概念?在阿里,這個等級可以擔(dān)綱中等設(shè)計項目主創(chuàng)人員。

你可能猜到了,這位魯班并不是人,而是來自阿里巴巴的人工智能產(chǎn)品,而它能擁有這樣速度,得益于人工智能技術(shù)近年來的迅速崛起,就在今天下午(4月21日),在UCAN大會上,我們見到了煥然一新的魯班系統(tǒng),這一次,它給人帶來的想象更加豐富。

阿里巴巴智能設(shè)計實驗室負責(zé)人吳春松

在2015年之前,淘寶商品推薦都是通過人工運營控制,但龐大的用戶需求和運營資源的不對等帶來的問題,需要通過技術(shù)解決。如果你是淘寶老用戶,你會發(fā)現(xiàn)如今的淘寶是“千人千面”的,每個人都會有屬于自己的商品首頁,而專屬于每個人的頁面信息,就需要大量的圖片支持,這就是魯班誕生的原因。

和人學(xué)習(xí)的過程類似,作為AI設(shè)計師的魯班,也是從模仿開始,當(dāng)輸入海量設(shè)計海報、banner等信息之后,它會對于其中的背景、主體、修飾等元素進行識別,由此理解它們間的關(guān)系。隨后,魯班會“照貓畫虎”一樣對這些素材進行組合,嘗試風(fēng)格不同的組合后,這些隨機生成的圖片會通過機器來判斷并進行打分,因此生成一系列最優(yōu)結(jié)果反饋給神經(jīng)網(wǎng)絡(luò),并最終成為阿里電商平臺對外展示的海報、banner等圖像。

“2016年的雙 11,魯班制作了 1.7 億張廣告banner,如果全靠設(shè)計師人手來完成,假設(shè)每張圖耗時 20分鐘,滿打滿算需要100個設(shè)計師連續(xù)做 300年!薄棒敯唷眲(chuàng)始人、阿里巴巴智能設(shè)計實驗室負責(zé)人吳春松(花名樂乘)告訴我們,因為每年雙 11 的海量設(shè)計需求,設(shè)計師需要有這樣的工具幫助提升效率。

實際上,從2016年以來,如果你打開淘寶,遇到雙 11 等大型活動,看到那些花花綠綠充滿設(shè)計風(fēng)格的海報作品,不要懷疑,它們的確有不少是機器生成的,并且沒有一張完全一樣。到2017年,魯班一天就能完成4000萬張海報,平均每秒8000張。2018年,從新手做起兩年時間后,魯班終于迎來了對外開放的時刻。

樂乘告訴我們,今年魯班將會改名“鹿班”,并在五月份把核心能力對外開放,其核心能力主要包含四個方面:

1,一鍵生成:將商品相關(guān)素材、文字輸入,選擇自己需要的海報尺寸、風(fēng)格等,可自動生成符合要求的海報作品。

2,智能排版:將拍攝好的照片和需要的文字輸入,選擇尺寸,可自動生成帶有隨機風(fēng)格的海報作品或產(chǎn)品展示。

3,設(shè)計拓展:將設(shè)計完成稿輸入,選擇需要拓展的尺寸,可自動生成相應(yīng)拓展尺寸的結(jié)果。

4,智能創(chuàng)作:擁有自己獨特風(fēng)格的設(shè)計師將自己創(chuàng)作好的系列作品輸入,可以訓(xùn)練機器,并成為系統(tǒng)新的效果風(fēng)格。

其中,前三點核心能力主要面向企業(yè)和商家,第四點能力則是面向設(shè)計師群體,讓他們用另一種方式賣出自己的作品,這樣既能夠讓設(shè)計靈感變現(xiàn),同時也能為這套AI系統(tǒng)不斷升級。樂乘告訴我們,作為阿里巴巴的AI落地應(yīng)用,開放后的“魯班”將會成為一個新的商業(yè)項目,而生產(chǎn)海報的費用相比人工來講會降低很多。

這里面令人好奇的事情在于,作為一項將新的商業(yè)項目,海報生成的結(jié)果能否讓付費用戶滿意?每個人對于好不好看有自己的評價標(biāo)準(zhǔn),“魯班”要靠什么來達到這一標(biāo)準(zhǔn)?為了解決這個問題,“魯班”項目選擇和清華大學(xué)建立合作,清華大學(xué)計算機系“長江學(xué)者”特聘教授、人機交互研究所所長史元春教授,目前擔(dān)任“魯班”的視覺美學(xué)評估總負責(zé),她表示:

“美學(xué)可以牽涉到很多問題,基本的是我看到一個東西,我總體的感官和它的主題,這對人的視覺感受來說,在心理學(xué)上已經(jīng)有一些可以參考的依據(jù),而這些依據(jù)可利用已有的大量數(shù)據(jù)驗證,并且成為構(gòu)造算法的依據(jù)。”

實際上這一套美學(xué)相關(guān)的判斷標(biāo)準(zhǔn)也經(jīng)過阿里巴巴電商平臺大數(shù)據(jù)的不斷反饋來進行調(diào)整,清華大學(xué)在這方面的研究也會得到進一步驗證,因此從商業(yè)場景考慮,AI設(shè)計師“魯班”已經(jīng)不再是試驗性質(zhì)的產(chǎn)品。

目前,這套系統(tǒng)一端將對接商家和企業(yè),另一端則連接設(shè)計師和一些素材庫,在和樂乘的溝通中,他告訴我們,目前已經(jīng)合作的包括視覺中國、花瓣等圖片庫以及方正字庫、漢儀字庫等正版字庫,因此從實用角度來看,生成的結(jié)果不會遜色于設(shè)計師,并且商家和企業(yè)也可以在使用時事先預(yù)覽結(jié)果,找到最滿意的結(jié)果再選擇付費。

不過,魯班并非要取代設(shè)計師的工作,即便目前功能如此好用,卻仍舊需要大量數(shù)據(jù)讓它成長起來,樂乘告訴我們,今天的人工智能都是基于大數(shù)據(jù)規(guī)模結(jié)構(gòu)化標(biāo)注數(shù)據(jù),設(shè)計行業(yè)在不斷變化,如果沒有辦法提供新的數(shù)據(jù),那么魯班就只能停留在過去的階段,畢竟只有人能夠主觀創(chuàng)造新的設(shè)計趨勢和風(fēng)格,魯班的存在更多的是解決讓設(shè)計師感到繁重的體力工作。而訓(xùn)練它還需要我們?nèi)祟悾@也是目前官方正在進行“馴鹿”計劃,讓設(shè)計師參與進來的重要原因。

在讓AI協(xié)助人類的這條路上,除了“魯班”系統(tǒng),阿里巴巴這次還對外展示了全新的短視頻AI工具 Aliwood,這套工具也將會成為淘寶店家日后的重要利器。

Aliwood是一個短視頻生成工具,它最重要的作用是通過自動分析淘寶商品詳情頁面,生成一段 20秒內(nèi),帶有音樂、文字和圖像信息的短視頻。它的出現(xiàn),可以說最大程度解決了淘寶店主商品展示的需求。

阿里巴巴達摩院自然交互體驗實驗室負責(zé)人傅利民

“我們發(fā)現(xiàn)在線下,一些有音樂和視頻展示的店,銷量會有 2 到 5 倍的增加,在線上,商品有音樂和視頻展示,分享率會增加 40%左右,銷售量上的提升大概時 18%左右,但淘寶目前有數(shù)十億計的商品,90%都是圖片+文字,商家要想做視頻,找專業(yè)的人做需要 2 萬左右一個,費用很高。”

阿里巴巴達摩院自然交互體驗實驗室負責(zé)人傅利民告訴我們,確立這樣的通過圖文轉(zhuǎn)短視頻的項目是基于真實需求場景來考慮的,而利用Aliwood這樣的工具,對于商家銷量將有很好的效果。

“純粹從時間看,如果把淘寶 20億的商品,在一年內(nèi)都生成短視頻,大概需要 50萬的設(shè)計師,這樣是做不到的。我們萌生了這樣的想法,能夠真正幫助到商家做這樣的事情。從內(nèi)容的提取,關(guān)鍵詞的抽取最后合成,包括里面的情感計算,怎么樣找到對的音樂能夠有正向情緒的延伸,最后合成在里面!

而說到視頻,不論是我們?nèi)缃衩刻煸谒⒌亩兑艋蛘呖焓郑魳泛彤嬅娴呐浜隙荚诔蔀橛绊憶Q定算法的重要因素,音樂的使用很容易抓住用戶情感,而好的音樂來自于更強大的情感計算能力。浙大-阿里 IDEA Lab 負責(zé)人孫凌云教授告訴我們,在Aliwood研發(fā)的過程當(dāng)中,正因為音樂的添加,讓視頻信息量一下子增加了很多,而要做出這樣的知識圖譜,浙大的研究團隊還從電影中去學(xué)習(xí)了這方面的內(nèi)容。

在Aliwood這個工具中,音樂是通過基本元素庫和畫面相互匹配來生成的,“比如我們要剪一個服裝相關(guān)的小片子,這個過程中我們呈現(xiàn)的是模特的數(shù)據(jù),下一秒有平緩的轉(zhuǎn)換,呈現(xiàn)得是這件衣服穿上身轉(zhuǎn)一圈的角色,這個轉(zhuǎn)換是對于音樂庫中某一中節(jié)奏或者是某一個特效有一個匹配關(guān)系!睂O教授告訴我們,但這只是一種方式,另一種方式是通過先找到合適的音樂,然后反向去組織短視頻的素材,在目前Aliwood這一工具中,兩種方式都在運用。

短視頻展示商品自然要比圖片更加直觀好看,而隨著網(wǎng)絡(luò)帶寬的加強,流量成本降低無疑讓大家在購買商品時會更青睞于商品的視頻化展示,如果說魯班要做的是讓你第一眼就看到商品,那么Aliwood要做的是讓你第二眼就能了解商品,對于阿里這一以電商業(yè)務(wù)為主的平臺來說,這兩個AI工具的推出,正式把平臺的上的數(shù)據(jù),用更加效率化的方式展現(xiàn)給每一個用戶。

當(dāng)然,這兩個工具目前還都只利用于阿里平臺內(nèi)(不過不局限于淘寶天貓),用樂乘的說法是“阿里的平臺數(shù)據(jù),學(xué)到的都是阿里的設(shè)計,有什么樣的數(shù)據(jù)有什么樣的智能,要用到企業(yè)設(shè)計風(fēng)格的閉環(huán),是一種數(shù)據(jù)挑戰(zhàn)。”我們有理由相信,隨著AI技術(shù)的更快速發(fā)展,我們會見到更多這樣實際的應(yīng)用出現(xiàn)在我們身邊,而利用好這些工具,需要每一個人重新去理解人和AI之間的關(guān)系,正如微軟CEO納德拉說的那樣:

“每個人的基本需求是能夠更有效利用自己的時間,而不是讓AI說讓我們來取代你!

聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點和對其真實性負責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問題的,請聯(lián)系我們。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標(biāo)題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號