訂閱
糾錯
加入自媒體

大模型走向產(chǎn)業(yè)的一小步,AI走向普惠的一大步

2022-05-21 10:27
腦極體
關(guān)注

蒸汽機(jī),在工業(yè)革命中扮演著怎樣的角色?

保爾·芒圖在《十八世紀(jì)產(chǎn)業(yè)革命》中是這樣形容蒸汽機(jī)的:“蒸汽機(jī)并不創(chuàng)造大工業(yè)。但是它卻為大工業(yè)提供了動力,更重要的是使大工業(yè)具有統(tǒng)一性。使用蒸汽機(jī),使一切工業(yè)的發(fā)展都要服從一般的法則,工業(yè)世界成為一個巨大的工廠!

可以說,蒸汽機(jī)是工業(yè)革命的心臟,是手工生產(chǎn)走向模塊化、標(biāo)準(zhǔn)化的通道。此后每一次產(chǎn)業(yè)革新中,世界的優(yōu)先任務(wù)都是尋找那部“蒸汽機(jī)”。當(dāng)深度學(xué)習(xí)推動AI技術(shù)又一次復(fù)興,人類對它的最高期待,就是讓AI成為第四次產(chǎn)業(yè)革命中的“蒸汽機(jī)”。而近幾年身處智能革命前沿的,就是預(yù)訓(xùn)練大模型。

然而必須正視的是,全球大模型競賽中,我們看到大模型的參數(shù)越來越大,數(shù)據(jù)集記錄不斷被刷新。但真正的產(chǎn)業(yè)空間里,卻很難看到大模型規(guī);、標(biāo)準(zhǔn)化應(yīng)用。這可能是因?yàn)榇竽P团c行業(yè)知識不相匹配,行業(yè)算力基礎(chǔ)難以負(fù)載大模型部署等等問題。我們似乎一直都在造一臺不能走進(jìn)工廠的“蒸汽機(jī)原型機(jī)”。

在中學(xué)課本里,我們都知道是瓦特改良了蒸汽機(jī),卻沒有提是誰發(fā)明了蒸汽機(jī)。其原因在于,瓦特真正解決了蒸汽機(jī)走向應(yīng)用的問題,從技術(shù)、產(chǎn)品、商業(yè)模式等問題上讓蒸汽機(jī)具有與行業(yè)結(jié)合的可行性。

就在剛剛,似乎大模型也跨出了這歷史性的一步。

百度與國家電網(wǎng)、浦發(fā)銀行等行業(yè)頭部企業(yè)聯(lián)合研發(fā),融合了通用數(shù)據(jù)和行業(yè)特有知識,推出知識增強(qiáng)能源行業(yè)NLP大模型國網(wǎng)-百度·文心,和知識增強(qiáng)的金融行業(yè)NLP大模型浦發(fā)-百度·文心,顯著提升了大模型在行業(yè)任務(wù)上的應(yīng)用效果。

“行業(yè)大模型”,這個我們從沒聽說過的概念背后,是大模型走向應(yīng)用化的開端,是百度多年探索深度學(xué)習(xí)技術(shù)走向產(chǎn)業(yè)的又一次瓜熟蒂落。

大模型走向產(chǎn)業(yè)的一小步,AI走向普惠的一大步

5月20日,由深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程研究中心主辦、百度飛槳承辦的WAVE SUMMIT 2022深度學(xué)習(xí)開發(fā)者峰會在線上舉行。期間,百度首席技術(shù)官、深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程研究中心主任王海峰博士發(fā)表主題演講,提出“產(chǎn)業(yè)級深度學(xué)習(xí)開源開放平臺飛槳助力人工智能越來越普惠,賦能千行百業(yè),惠及千家萬戶”。

大模型走向產(chǎn)業(yè)的一小步,AI走向普惠的一大步

2019年的WAVE SUMMIT,王海峰提出深度學(xué)習(xí)技術(shù)已經(jīng)具備通往工業(yè)大生產(chǎn)的條件,并且明確了標(biāo)準(zhǔn)化、模塊化、自動化的三大特征。彼時(shí)開始,百度與AI開發(fā)者、各行業(yè)AI應(yīng)用者共同開始了一場在21世紀(jì)筑造蒸汽機(jī)的旅程。如今,王海峰指出在AI工業(yè)大生產(chǎn)階段,深度學(xué)習(xí)技術(shù)的通用性越來越強(qiáng),深度學(xué)習(xí)平臺的標(biāo)準(zhǔn)化、自動化和模塊化特征越來越顯著,深度學(xué)習(xí)應(yīng)用越來越廣泛且深入,已經(jīng)遍地開花。

技術(shù)、平臺、應(yīng)用三層標(biāo)準(zhǔn),是一項(xiàng)技術(shù)走向產(chǎn)業(yè)普適的核心;氐秸羝麢C(jī)的故事,瓦特也是改寫了蒸汽機(jī)的這三大要素。在技術(shù)上實(shí)現(xiàn)了氣缸恒熱,確保了機(jī)械效率;在平臺上實(shí)現(xiàn)了器件的標(biāo)準(zhǔn)化,工廠能買到可維護(hù)、可換新的產(chǎn)品;在應(yīng)用上則與大量工廠主合作,讓蒸汽機(jī)走進(jìn)經(jīng)濟(jì)生產(chǎn)。就這樣,原本昂貴、效率差、損壞率高的蒸汽機(jī),變成了高效、低門檻的工業(yè)化代名詞。

今天,百度和中國AI產(chǎn)業(yè)也在進(jìn)行這樣的探索。大模型讓深度學(xué)習(xí)的技術(shù)效能不斷增強(qiáng),飛槳實(shí)現(xiàn)了AI工業(yè)大生產(chǎn)所需的平臺化支撐,百度與各行業(yè)開發(fā)者的合作,讓AI應(yīng)用之花開遍了中國原野。

在WAVE SUMMIT 2022,我們可以清晰看到深度學(xué)習(xí)技術(shù),預(yù)訓(xùn)練大模型,是如何一步步變成那臺“蒸汽機(jī)”的。

大模型做實(shí),從無盡跑分轉(zhuǎn)向全面可用

預(yù)訓(xùn)練大模型是近幾年AI產(chǎn)業(yè)最火熱的技術(shù)名詞。拼模型參數(shù),拼任務(wù)集完成效果,是廠商推出大模型后最喜歡做的幾件事。換個角度看,大模型依舊處在“無盡跑分”的初級階段。

從高分到高能,大模型距離現(xiàn)實(shí)中的產(chǎn)業(yè)場景還有不短的路程要走。比如很多產(chǎn)業(yè)需求無法用通用模型來處理,技術(shù)與使用場景之間存在代溝。再比如超大規(guī)模模型在部署時(shí)會面臨一系列問題,比如算力、調(diào)參難度、硬件兼容性等。

讓大模型從“跑分考場”走向千行百業(yè),需要一場全面的轉(zhuǎn)向。而這就是今年WAVE SUMMIT最亮眼的一個發(fā)布和升級。

大模型走向產(chǎn)業(yè)的一小步,AI走向普惠的一大步

百度集團(tuán)副總裁、深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程研究中心副主任吳甜表示,今年是大模型產(chǎn)業(yè)落地的關(guān)鍵年,飛槳文心大模型通過搭建更適配場景需求的大模型體系,提供全流程支持應(yīng)用落地的工具、平臺和方法,建設(shè)激發(fā)創(chuàng)新的開放生態(tài),解決大模型技術(shù)與場景需求匹配的關(guān)鍵問題。

大模型走向產(chǎn)業(yè)的一小步,AI走向普惠的一大步

面向行業(yè)智能化需求,百度圍繞大模型產(chǎn)業(yè)級與知識增強(qiáng)兩大關(guān)鍵詞,公布了全新的飛槳文心大模型全景圖。在模型方面,形成基礎(chǔ)大模型、任務(wù)大模型、行業(yè)大模型的三級體系,以更有效地支持應(yīng)用需求,并發(fā)布10個全新的大模型;為促進(jìn)大模型惠及最廣泛的行業(yè)與開發(fā)者,還配套發(fā)布大模型套件、API、平臺,并建設(shè)大模型創(chuàng)意和探索社區(qū)旸谷,來幫助開發(fā)者更低門檻地應(yīng)用。

文心大模型家族新增的十個大模型,基礎(chǔ)大模型包括融合任務(wù)相關(guān)知識的千億大模型ERNIE 3.0 Zeus、多任務(wù)視覺表征學(xué)習(xí)VIMER-UFO 2.0、商品圖文搜索表征學(xué)習(xí)VIMER-UMS、文檔圖像表征學(xué)習(xí)VIMER-StrucTexT 2.0、語音-語言跨模態(tài)大模型ERNIE-SAT和地理-語言跨模態(tài)大模型ERNIE-GeoL,任務(wù)大模型包括面向生物計(jì)算領(lǐng)域的化合物表征HELIX-GEM、蛋白質(zhì)結(jié)構(gòu)分析HELIX-Fold。

尤其值得注意的,還有文心大模型在業(yè)界首次打造發(fā)布的兩個行業(yè)大模型,實(shí)現(xiàn)了通用模型為主干,任務(wù)模型面向具體需求,行業(yè)模型面向具體產(chǎn)業(yè)的“三元化結(jié)構(gòu)”,從而使得不同需求、不同行業(yè)的開發(fā)者可以第一時(shí)間找尋到大模型的落地方案,不再“望大模型而興嘆”。

最新發(fā)布的行業(yè)大模型,包括國網(wǎng)-百度·文心電力行業(yè)大模型和浦發(fā)-百度·文心金融行業(yè)大模型。背后是百度與國家電網(wǎng)、浦發(fā)銀行等行業(yè)頭部企業(yè)進(jìn)行了聯(lián)合研發(fā)與創(chuàng)新,更好地融合了通用數(shù)據(jù)和行業(yè)特有知識,從而有效提升了大模型在電力、金融領(lǐng)域的行業(yè)任務(wù)應(yīng)用效果。

行業(yè)大模型可以說是一個業(yè)界期待了很久的轉(zhuǎn)折點(diǎn)。從拼數(shù)值到效果落地,大模型需要一個轉(zhuǎn)向應(yīng)用化,強(qiáng)聯(lián)接產(chǎn)業(yè)的范式與方法,而行業(yè)大模型則正填補(bǔ)了這一空白。

除此之外,百度還發(fā)布了圍繞大模型的全新開發(fā)套件,讓開發(fā)者可用高效率應(yīng)用大模型開發(fā),同時(shí)提供相應(yīng)的平臺功能與API服務(wù),進(jìn)一步降低大模型使用門檻;在生態(tài)建設(shè)方面,文心大模型將共享飛槳生態(tài),通過基于文心大模型推出的創(chuàng)意社區(qū)——文心·旸谷大模型創(chuàng)意與探索社區(qū),讓更多用戶感受到文心大模型的應(yīng)用潛力。

2022年,歐美科技公司依舊執(zhí)著在大模型參數(shù)上不斷強(qiáng)化,再強(qiáng)化;而百度AI則將大模型轉(zhuǎn)向了行業(yè)場景與真實(shí)需求。這個分叉路口的交錯,會給未來提供太多可能性。

飛槳做深,支撐大模走向產(chǎn)業(yè)

無論是傳統(tǒng)的深度學(xué)習(xí)模型還是大模型,都離不開開發(fā)平臺的有效支撐。百度能夠推動大模型快速走向產(chǎn)業(yè)化落地,從產(chǎn)業(yè)需求中真實(shí)吸收和提煉大模型的升級方向,本質(zhì)上離不開深度學(xué)習(xí)平臺飛槳,已經(jīng)建立了與開發(fā)者、產(chǎn)業(yè)界、學(xué)界的高效溝通通道。

在飛槳的生態(tài)基礎(chǔ)上,百度可以最快速看到中國AI場景與開發(fā)者的需求,以高速的頻率做出回饋,最終組成產(chǎn)業(yè)需求與平臺供給之間的急速互動。放眼全球AI產(chǎn)業(yè),這可能是技術(shù)、平臺、產(chǎn)業(yè)之間互動的最佳范式。

每次WAVE SUMMIT,我們都能看到飛槳進(jìn)行巨量的技術(shù)升級,讓人感覺似乎已經(jīng)不可能有新的升級空間,然后又一次次完成突破。這背后就是最懂中國需求,與產(chǎn)業(yè)智能同在的飛槳范式。

在技術(shù)、場景、生態(tài)的三大領(lǐng)域,飛槳完成了進(jìn)一步深化。深挖技術(shù)方面,飛槳框架v2.3正式發(fā)布。沿著動靜統(tǒng)一的框架設(shè)計(jì)理念,繼續(xù)將開發(fā)效率與靈活性結(jié)合到一起,讓開發(fā)平臺突破性達(dá)到了更加成熟的狀態(tài)。同時(shí)也將模型壓縮技術(shù)進(jìn)行了升級,提升了深度學(xué)習(xí)模型的自動化部署能力。

大模型走向產(chǎn)業(yè)的一小步,AI走向普惠的一大步

在平臺層面,飛槳推出了最懂中國AI場景的訓(xùn)推一體導(dǎo)航圖,打通了全流程的智能導(dǎo)航,更新了產(chǎn)業(yè)模型庫和產(chǎn)業(yè)實(shí)踐,讓開發(fā)者可以更低門檻獲得開發(fā)經(jīng)驗(yàn)與開發(fā)能力。與此同時(shí),支撐科學(xué)計(jì)算的PaddleScience賽槳,以及便攜式AI工作站,也解決了現(xiàn)實(shí)場景中最迫切的AI開發(fā)需求。

在生態(tài)領(lǐng)域,飛槳提出了共建硬件生態(tài)圈的新行動。AI落地行業(yè)場景,是不可能離開硬件適配與算力底座的。這可能是很多算法為核心的AI企業(yè)很少提到的話題,卻是產(chǎn)業(yè)智能化不能規(guī)避的一面。在飛槳一步步走向AI工業(yè)大生產(chǎn)平臺的過程里,也在一步步探索與硬件廠商合作、互補(bǔ),組成生態(tài)。在2020年,飛槳還是更多去尋找硬件合作伙伴,達(dá)成兼容性合作,也就是共聚階段。那一年,百度與13家伙伴聯(lián)合發(fā)起了飛槳硬件生態(tài)圈,促進(jìn)AI產(chǎn)業(yè)鏈的適配升級;2021年,硬件伙伴開始與飛槳共同創(chuàng)新,共同研發(fā)更好的AI落地方式,共同創(chuàng)新開始成為飛槳硬件生態(tài)的推動力;時(shí)間來到今天,飛槳的硬件生態(tài)已經(jīng)初具規(guī)模,合作進(jìn)一步深化,實(shí)現(xiàn)了全面共創(chuàng)。如今,百度已經(jīng)和硬件伙伴一起推出廠商版飛槳框架、建設(shè)模型庫、開發(fā)課程,共同加速產(chǎn)業(yè)智能化升級。

大模型走向產(chǎn)業(yè)的一小步,AI走向普惠的一大步

至此,飛槳已經(jīng)可以從架構(gòu)、硬件、行業(yè)場景、開發(fā)特殊需求等等維度,實(shí)現(xiàn)由最深處支撐大模型落地,AI工業(yè)化開發(fā)。截至目前,飛槳平臺已凝聚477萬開發(fā)者,服務(wù)18萬家企事業(yè)單位,累計(jì)創(chuàng)建了56萬個模型。

飛槳,正在像蒸汽機(jī)、電力、燃油一樣,成為可以低門檻、高效率應(yīng)用的千行百業(yè)生產(chǎn)底座。

百度AI,正在分子化融入中國大地

文心大模型成為首個全面轉(zhuǎn)向應(yīng)用的大模型序列;飛槳成為了最了解中國經(jīng)濟(jì)需求,最深入中國AI場景的開發(fā)平臺。這不是一場魔法,不是什么突然實(shí)現(xiàn)的黑科技,而是一段一脈相承,步步為營的故事。

幾年前,有太多企業(yè)面對著AI許下了宏大的心愿,但今天他們再也不提起AI了。畫幾頁P(yáng)PT,宣布一個龐大愿景很容易。但在大浪褪去后,堅(jiān)定實(shí)踐每一個諾言卻很難。在WAVE SUMMIT上,我們能看到百度依舊扛著深度學(xué)習(xí)的旗幟,向技術(shù)的無人區(qū),向產(chǎn)業(yè)的戰(zhàn)略高地,向中國大地最深層智能化需求沖過去。

面向讓AI開發(fā)標(biāo)準(zhǔn)化、自動化、模塊化的目標(biāo),百度AI將自己一步步解耦,再以最小的分子化形態(tài)融入中國無比廣泛的開發(fā)需求。在遠(yuǎn)離喧囂的鄉(xiāng)村角落,在最嚴(yán)苛的工業(yè)核心,在最前沿的科學(xué)研究,百度的AI技術(shù)都能滲透進(jìn)去。他們把深度學(xué)習(xí)的鐵杵磨成了針,深入那些真正需要智能的產(chǎn)業(yè)縫隙里。

你可能不會想到,AI能夠在牧區(qū)的農(nóng)貿(mào)市場完成“相!睅煾档墓ぷ,推動畜牧業(yè)走向市場標(biāo)準(zhǔn)化,現(xiàn)代化。這背后是飛槳的低門檻特性作為支撐。

你可能不會想到,在數(shù)據(jù)不能出車間的工廠里,飛槳可以通過便攜式AI工作站抵達(dá)生產(chǎn)核心,帶來工業(yè)智能化的無窮想象。而這只是飛槳產(chǎn)業(yè)級特性的一個縮影。

你可能不會想到,飛槳已經(jīng)在與中國所有主流的超算中心進(jìn)行適配,為了幫助前沿科學(xué)研究項(xiàng)目走向智能化。這只是飛槳在跨領(lǐng)域、跨學(xué)科探索的一個側(cè)面。

從2019年正式提出工業(yè)化大生產(chǎn)目標(biāo),百度AI依托飛槳連綿不絕的升級,開始伴隨各行業(yè)一起步入深度學(xué)習(xí)賦能產(chǎn)業(yè)的深水區(qū)。2020年,突如其來的疫情帶來了一系列變化,各行業(yè)開始加速擁抱數(shù)字化、智能化,這也讓飛槳更加高效地肩負(fù)起支撐產(chǎn)業(yè)的責(zé)任。2021年,瞄準(zhǔn)AI技術(shù)降低門檻,融合創(chuàng)新的新特點(diǎn),百度持續(xù)打造了低門檻的飛槳使用體驗(yàn),推出了知識增強(qiáng)大模型的關(guān)鍵創(chuàng)新。

伴隨著百度AI的步步深入,一次次降低門檻,提升技術(shù)支撐力,各行業(yè)也開啟了更加積極的AI探索。從少量先行者探索AI,到大量企業(yè)開始“工坊”式嘗試AI,再到企業(yè)開始以大規(guī)模資源協(xié)同的方式,啟動AI工業(yè)化大生產(chǎn)。千行百業(yè)的智能化、數(shù)字化需求逐年深入,隨之而來的智能需求也不斷加強(qiáng)。為此,百度打造了以云計(jì)算為基礎(chǔ),以AI為引擎的賦能形態(tài),支撐企業(yè)數(shù)字化、智能化升級一步到位。

在技術(shù)供給與產(chǎn)業(yè)需求同步提升的同時(shí),百度此前提出培養(yǎng)500萬AI人才的目標(biāo)也在持續(xù)進(jìn)展。各種各樣的產(chǎn)學(xué)研聯(lián)合培養(yǎng)方式與AI技術(shù)社區(qū),保障了智能化過程中的人才基礎(chǔ)。

王海峰認(rèn)為,在深度學(xué)習(xí)技術(shù)及平臺的支撐下,人工智能呈現(xiàn)出融合創(chuàng)新、降低門檻的特點(diǎn),將繼續(xù)推動科技革命和產(chǎn)業(yè)變革,加快產(chǎn)業(yè)智能化升級。

這些特點(diǎn)并不是憑空浮現(xiàn),而是一步步探索出來,一點(diǎn)點(diǎn)錘煉出來。在技術(shù)研發(fā)、平臺打造、生態(tài)培育、應(yīng)用落地的一重重探索下,真正的普惠AI正在實(shí)現(xiàn)。

時(shí)間來到2022年,面對大模型走向?qū)嵱没,各行業(yè)開始以AI重構(gòu)和升級生產(chǎn)力核心。我們會有點(diǎn)驚奇地發(fā)現(xiàn),那個把AI技術(shù)變成21世紀(jì)的蒸汽機(jī),讓第四次工業(yè)革命發(fā)生在中國的諾言,似乎開始一步步,一點(diǎn)點(diǎn)地實(shí)現(xiàn)了?

那些聽起來稚嫩的希望,

那些看上去荒唐的夢想,

那些遲遲不敢說出口的諾言,

就去試試吧。

就去一次次調(diào)參那些模型,去在深夜里回復(fù)每個開發(fā)者的疑問,就去深入車間,深入牧場,深入實(shí)驗(yàn)室。去直面需求,升級技術(shù),錘煉平臺,共創(chuàng)生態(tài),去實(shí)現(xiàn)那個關(guān)于大模型,關(guān)于深度學(xué)習(xí)技術(shù)的,最深的,最大的,也是最美好的夢。

中國AI不是一張空頭支票。而是真的有人在把大模型、把AI技術(shù)變成一個機(jī)會,一個撬動產(chǎn)業(yè)變革,撬動智能革命的機(jī)會。

大模型走向產(chǎn)業(yè)的一小步,AI走向普惠的一大步

還記得年少時(shí)的夢嗎?

像朵永遠(yuǎn)不凋零的花

讓第四次工業(yè)革命發(fā)生在中國,又為什么不能實(shí)現(xiàn)呢?

       原文標(biāo)題 : 大模型走向產(chǎn)業(yè)的一小步,AI走向普惠的一大步

聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報(bào)。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標(biāo)題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號