訂閱
糾錯(cuò)
加入自媒體

AI的新田園牧歌:反碎片化是AI+農(nóng)業(yè)的關(guān)鍵

文/當(dāng)下君

圖片/來源網(wǎng)絡(luò)

中國的農(nóng)耕文化,是世界上最早的文化之一,也是對人類影響最大的文化體系之一。

在距今10000~8000年間,中國早期農(nóng)業(yè)已形成了以水稻為代表的南方水田農(nóng)業(yè)和以粟為代表的北方旱作農(nóng)業(yè)兩大系統(tǒng),并在這個(gè)格局中,孕育了輝煌燦爛的中華文明。

也許在你的印象中,農(nóng)業(yè)就是田園牧歌,就是面朝黃土背朝天,這或許不假,但并非全部。

9月10日,國際糧食減損大會(huì)在濟(jì)南開幕。會(huì)上指出,全球新冠疫情、國際性沖突戰(zhàn)亂和氣候變化三大挑戰(zhàn),使得全球糧食系統(tǒng)面臨前所未有的壓力,2020年全球共有7.2-8.11億人口面臨饑餓威脅,全球近1/3人口無法獲得充足的食物與營養(yǎng)。

相比之下,中國的糧食無論從總產(chǎn)還是單產(chǎn),都不斷在提升。從我國糧食生產(chǎn)的能力和水平來看,我們國家糧食安全總體形勢是好的。但是,對于一個(gè)15億人口的大國,對于一個(gè)人均耕地在全球中下的現(xiàn)狀,只有通過科技創(chuàng)新保障糧食安全,才能讓中國人的飯碗始終能夠端在自己手中。

而AI這種最新的前沿科技,已經(jīng)在默默地為中國的農(nóng)業(yè)發(fā)展貢獻(xiàn)著力量,而其中開拓者的艱辛與努力,值得我們敬佩。

1

闖過農(nóng)業(yè)AI化的第一道難關(guān)

在寫AI是如何為農(nóng)業(yè)插上科技的翅膀之前,我們首先有必要糾正一些刻板的印象。

很多人或許認(rèn)為,作為古老的第一產(chǎn)業(yè),農(nóng)業(yè)距離AI這種數(shù)字技術(shù)極為遙遠(yuǎn)。

這個(gè)印象不能說完全錯(cuò),但也并不完全正確。

首先,從國策的角度來說,讓農(nóng)業(yè)插上數(shù)字智慧的翅膀,并不是昨天或者今天才開始的。而是早在2014年,我國就提出了“智慧農(nóng)業(yè)”概念,而到了2016年“智慧農(nóng)業(yè)”就首次被寫入“中央一號文件”。

如果對照一下時(shí)間表,會(huì)發(fā)現(xiàn)國內(nèi)AI頭雁百度在2013年成立深度學(xué)習(xí)研究院,在2016年推出了目前全球TOP3的深度學(xué)習(xí)平臺(tái)——飛槳。

換句話說,智慧農(nóng)業(yè)的提出和落實(shí),幾乎是和國內(nèi)AI產(chǎn)業(yè)發(fā)展的前沿時(shí)間線是完全重疊在一起的。換言之,這是一個(gè)宏觀環(huán)境和具體創(chuàng)新幾乎完全同步的領(lǐng)域。

中國的智慧農(nóng)業(yè),開局就踩在了AI大發(fā)展的時(shí)間點(diǎn)上,這對我們來說,不能說不是一種幸事。

而2016年之后,每年中央都會(huì)出臺(tái)新的政策規(guī)劃鼓勵(lì)智慧農(nóng)業(yè)的發(fā)展,而中國的AI體系建設(shè)也不斷發(fā)展,這兩條路徑始終伴隨和交疊。

但也如大多數(shù)人想象的一樣,農(nóng)業(yè)的確和政企、金融等領(lǐng)域不一樣,后者擁有完整的信息化基礎(chǔ)設(shè)施,AI的加入,是在原有良好基礎(chǔ)上的轉(zhuǎn)型升級;而對于農(nóng)業(yè)來說,數(shù)字化和智能化,幾乎是同步拉出一條躍遷曲線。

大家大概都知道,AI的三要素是算法、算力和數(shù)據(jù),其中數(shù)據(jù)扮演著燃料和土壤的角色,而對于古老的農(nóng)業(yè)來說,AI破局的首要關(guān)口,也正是數(shù)據(jù)關(guān)。

伯樂相馬,是一個(gè)千古流傳的典故!俺S星Ю锺R,而不常有伯樂”,也從一個(gè)側(cè)面說明,在沒有科技手段加持的情況下,要分辨牲畜的品相,是一個(gè)相當(dāng)困難的工作。

相傳伯樂是春秋時(shí)代的人,距今有2000多年的歷史。而在現(xiàn)實(shí)中,另一種歷史悠久的農(nóng)耕動(dòng)物——牛,它的交易、流通環(huán)節(jié),整體仍呈現(xiàn)出一種較為原始的模式。

就拿通遼市來說,這里的活牛年交易規(guī)模200萬頭,交易額200億元,輻射全國大部分省市區(qū),產(chǎn)業(yè)發(fā)展處于全國領(lǐng)先水平。

而在這里,大多數(shù)牛的交易仍集中在線下的牛市,每逢開集日,各大牛市人聲、牛聲、車聲鼎沸,但是,牛的議價(jià)環(huán)節(jié)長期由“牛經(jīng)紀(jì)人”掌控著,他們的“相牛技藝”讓牛的定價(jià)不夠清晰透明,極易造成信息不對稱。

但是,人們也不得不承認(rèn),造成信息不對稱的,是牛經(jīng)紀(jì)人確有絕技,一位熟悉牛市的人告訴筆者,僅僅憑著肉眼的觀察,這些經(jīng)紀(jì)人就能知道一頭牛有多重、一天能長多少斤,甚至還能知道小牛犢養(yǎng)到最后是賺是賠,其中的高手,一眼就能將牛只重量誤差控制在5斤以內(nèi)。

藍(lán)奧云牧作為內(nèi)蒙古畜牧服務(wù)行業(yè)重點(diǎn)企業(yè),是中國畜牧業(yè)協(xié)會(huì)(CAAA)會(huì)員單位,他們一直在籌劃一件大事——能不能用AI的一雙慧眼,把沉淀千年的相牛絕技,實(shí)現(xiàn)標(biāo)準(zhǔn)化、數(shù)字化,提煉出其中的經(jīng)驗(yàn)沉淀,最終變成一種可以便捷使用的能力,從而打通牛的流通環(huán)節(jié)中最難的一道關(guān)卡。

他們找到了百度,用“相牛人”的故事,打動(dòng)了飛槳團(tuán)隊(duì)。

對于飛槳來說,算法和算力,都不存在問題,然而問題卡在第一道關(guān)口上——訓(xùn)練一套成熟的“相!蹦P,需要大量的數(shù)據(jù)。

這里就體現(xiàn)出農(nóng)業(yè)AI化的門檻——對于一個(gè)落后、非標(biāo)準(zhǔn)的領(lǐng)域,沒有任何數(shù)據(jù)積累,甚至如何采集數(shù)據(jù)、采集什么樣的數(shù)據(jù)才能訓(xùn)練出有效的模型,都沒有現(xiàn)成的路徑可以依賴。

飛槳的工程師駐扎到了通遼,沒想到,這個(gè)項(xiàng)目一做就是三年。

早期的數(shù)據(jù)收集,尚做不到開發(fā)“火眼金睛”,首先要解決的是體重、尺寸等比較好抓住特征的顯性數(shù)據(jù),而由于沒有任何基礎(chǔ),飛槳團(tuán)隊(duì)必須通過人工拍照和測量來采集活牛數(shù)據(jù)。

筆者隨著飛槳的工程師參加了一次數(shù)據(jù)采集——三點(diǎn)鐘就要起床,很多人身上、腿上,都留下了牛踢傷的累累傷痕,然而盡管如此,好幾個(gè)工程師與牛場工作人員起早貪黑,一天卻最多只能測量不足十頭牛的數(shù)據(jù)。

幾個(gè)飛槳工程師——你或許對這個(gè)數(shù)據(jù)無感,但在AI人才非常稀貴的今天,即使在百度,這也是一筆非常驚人的人力資源開銷,要知道數(shù)年后,百度支持國家跳水隊(duì)開發(fā)出一套AI輔助訓(xùn)練系統(tǒng),派出的工程師也是以個(gè)位數(shù)計(jì)算的。

顯然,長此以往的操作,不僅會(huì)讓項(xiàng)目嚴(yán)重拖期,也會(huì)產(chǎn)生巨大資源耗費(fèi)。

為了突破數(shù)據(jù)難關(guān),飛槳的團(tuán)隊(duì)成員經(jīng)過幾個(gè)月的摸索和嘗試,終于研制出一套“立體三維點(diǎn)云數(shù)據(jù)采集裝置”,這套裝置包括專門定制的兩臺(tái)3D攝像頭和3D成像模型系統(tǒng),當(dāng)牛從過道中有序經(jīng)過時(shí),過道兩側(cè)的攝像頭便可以快速采集到牛的各種體尺數(shù)據(jù)和點(diǎn)云數(shù)據(jù),并進(jìn)行實(shí)時(shí)三維建模。

這里不得不提及一個(gè)利器——飛槳企業(yè)版EasyDL的EasyData智能數(shù)據(jù)服務(wù)平臺(tái),可以提供一站式數(shù)據(jù)服務(wù)工具,主要圍繞AI開發(fā)過程中所需數(shù)據(jù)的采集、清洗、標(biāo)注等提供完整的數(shù)據(jù)服務(wù)。

大家可能知道有個(gè)職業(yè)叫數(shù)據(jù)標(biāo)注師,但對于大量中小型企業(yè)、項(xiàng)目來說,人工標(biāo)注的成本極其高昂。

比如我們剛才提到了攝像頭,其實(shí),一個(gè)遠(yuǎn)低于相牛項(xiàng)目中使用的、最低端的130萬像素的攝像頭,在2M碼流的情況下,連續(xù)工作一天24小時(shí),將會(huì)生成約21G的視頻文件,如果依靠人來標(biāo)注將是巨大的工作量。

對于相牛項(xiàng)目來說,如果有一道分水嶺,那就是手工采集+標(biāo)注到自動(dòng)采集+EasyData一站式處理的飛躍,這里面不僅是從幾頭、幾十頭牛的有效數(shù)據(jù)到數(shù)千頭的差別,更是數(shù)據(jù)處理過程的高度自動(dòng)化、智能化的過程。

經(jīng)過近三年的“養(yǎng)!鄙,飛槳團(tuán)隊(duì)成員已采集到2000余頭有效的活牛數(shù)據(jù),并在牛場進(jìn)行初步測試,也終于使這套系統(tǒng)具備了擴(kuò)大規(guī)模部署的能力,這是一個(gè)典型的AI賦能農(nóng)業(yè)中,闖過數(shù)據(jù)關(guān)的故事。

同樣,在北京的大興區(qū)長子營鎮(zhèn),由裕農(nóng)、京東方后稷、百度智能云聯(lián)合打造的現(xiàn)代化水培植物工廠中,工程師們也遇到了數(shù)據(jù)難關(guān)。

這里,是現(xiàn)代農(nóng)業(yè)的一個(gè)縮影,沒有土壤,卻有廠房——郁郁蔥蔥的芝麻菜、雞毛菜和奶油生菜等平鋪生長在數(shù)百塊種植板上,種植板下流動(dòng)的是精準(zhǔn)配置的營養(yǎng)液,能提供蔬菜生長所需的所有營養(yǎng)。

然而,這樣現(xiàn)代化的廠房,卻有一個(gè)嚴(yán)重不足——終究需要人眼來判斷蔬菜的長勢,為此,廠里唯一一位農(nóng)學(xué)專家李開每天都要走上兩三萬步親自巡場,過年也不能休息。

為了開發(fā)出一套可以基于AI視覺觀測蔬菜成長的系統(tǒng),飛槳的工程師同樣遇到了數(shù)據(jù)難關(guān)——在蔬菜生長的全周期,每天都要雷打不動(dòng)的收集數(shù)據(jù),每天上午、下午需要在固定高度、位置、光線下拍攝照片,并對照片完成標(biāo)注。

筆者了解到,最開始、也是最常用的方法是,給蔬菜拍照,一張照片拍下6塊種植板,每塊種植板上有56棵菜,相當(dāng)于需要標(biāo)注300~400棵菜。

這里有一個(gè)專業(yè)術(shù)語——“克重”,這是指在一個(gè)標(biāo)準(zhǔn)的計(jì)量單位下,以克的重量單位的多少為計(jì)量標(biāo)準(zhǔn),一種蔬菜的“克重”訓(xùn)練需要標(biāo)注9萬棵蔬菜的原圖。

EasyData再次發(fā)威,通過這套系統(tǒng),人力只用標(biāo)注30%左右的數(shù)據(jù),其余的數(shù)據(jù)都可通過智能標(biāo)注功能自動(dòng)完成。

但即使如此,飛槳的工程師還不滿意,畢竟3萬張?jiān)瓐D的標(biāo)注也是一個(gè)非常巨大的工作量,為了進(jìn)一步減少標(biāo)注的工作量,他們又開發(fā)了一種新方案:一張照片只需拍1塊種植板,每塊種植板種56棵菜,采集一個(gè)生長周期需要45張圖,總計(jì)為2520棵菜。

從9萬棵菜到2520棵,這種新方法的標(biāo)注工作量直接降低了97%,從而實(shí)現(xiàn)了以極少的標(biāo)注量獲得成千上萬張訓(xùn)練數(shù)據(jù),現(xiàn)在已經(jīng)有好幾個(gè)模型開始使用新方案。

然而,數(shù)據(jù)只是農(nóng)業(yè)進(jìn)入AI的第一道關(guān)口。

1  2  下一頁>  
聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報(bào)。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個(gè)字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號