訂閱
糾錯(cuò)
加入自媒體

巨頭狂卷代碼大模型

2024-04-12 09:28
雷科技
關(guān)注

讓AI寫(xiě)代碼正在越來(lái)越流行。今天螞蟻集團(tuán)智能研發(fā)平臺(tái)CodeFuse推出了“圖生代碼”技術(shù),這一技術(shù)集成在CodeFuse上,可將網(wǎng)頁(yè)、App等設(shè)計(jì)圖一鍵轉(zhuǎn)化成前端代碼。不只是螞蟻,阿里云、百度、360、OpenAI、微軟、GitHub、Google等科技巨頭均在持續(xù)加碼代碼大模型,探索AI“自編程”。

看似高度專(zhuān)業(yè)且極具創(chuàng)造性的編程儼然已成大模型落地的核心領(lǐng)域之一,這聽(tīng)著就好像“機(jī)器人制造機(jī)器人”一樣酷。既然如此,“編程”本身將會(huì)被AI如何改變呢?

巨頭狂卷代碼大模型,

自然語(yǔ)言編程是終極目標(biāo)

互聯(lián)網(wǎng)時(shí)代,包括比爾蓋茨、喬布斯在內(nèi)的大佬都曾鼓勵(lì)人人都要學(xué)會(huì)編程,特別是兒童。然而前段時(shí)間,AI大佬、英偉達(dá)CEO黃仁勛卻在對(duì)孩子的寄語(yǔ)中稱(chēng),“生成式AI的發(fā)展大幅降低了學(xué)習(xí)編程的重要性。”而英偉達(dá)的工作,“就是創(chuàng)造計(jì)算技術(shù),讓所有人都不需要編程。”

不過(guò)黃仁勛并沒(méi)有否定編程本身的價(jià)值,只是他認(rèn)為AI可以讓每個(gè)人都能編程:“編程語(yǔ)言可以普及成為人類(lèi)的語(yǔ)言,現(xiàn)在世界上每個(gè)人都是程序員。這就是人工智能的奇跡。”

有了計(jì)算機(jī)就有了編程的概念。編程語(yǔ)言一直在進(jìn)化,從最初的二進(jìn)制,到后來(lái)的機(jī)器代碼,到匯編語(yǔ)言,再到高級(jí)語(yǔ)言。這些年,高級(jí)語(yǔ)言也在不斷革新。而編程語(yǔ)言不斷進(jìn)階的目的,就是為了讓編程難度更低、效率更高。按照這樣的路線來(lái)看,人人都掌握的自然語(yǔ)言將是“編程語(yǔ)言”進(jìn)化的終極形態(tài)。

圖片

(常見(jiàn)編程語(yǔ)言)

不過(guò),這就跟無(wú)人駕駛一樣:L5自動(dòng)駕駛終究只是理想,當(dāng)下智能汽車(chē)上商用的卻都是L3級(jí)輔助駕駛。短期內(nèi),“完全自然語(yǔ)言編程”不可能成為現(xiàn)實(shí)。但隨著AI大模型的發(fā)展,AI在編程以及研發(fā)中正在發(fā)揮日益重要的作用,科技巨頭無(wú)不在戰(zhàn)略布局,實(shí)現(xiàn)更加自動(dòng)化的研發(fā)模式。

2020年,OpenAI推出了擁有1.75萬(wàn)億參數(shù)、取得重大突破的GPT-3。21年,OpenAI基于GPT-3模型開(kāi)發(fā)了成功破圈的ChatGPT,與此同時(shí)也創(chuàng)建了Codex系統(tǒng),其可根據(jù)程序員的自然語(yǔ)言輸入進(jìn)行簡(jiǎn)單的代碼編寫(xiě)支持,這是AI編程的起點(diǎn)。

Codex的出現(xiàn),讓IT研發(fā)界大為震撼:AI可將程序員從重復(fù)、繁重、繁瑣以及機(jī)械的編程工作中解放出來(lái),讓他們專(zhuān)注于創(chuàng)造產(chǎn)品本身。正因?yàn)榇,在AI與研發(fā)軟件領(lǐng)域均有建樹(shù)的巨頭,如Google、微軟、阿里云、螞蟻、百度、360、華為均競(jìng)相研發(fā)并推出代碼大模型。

微軟推出了OpenAI Dall-E驅(qū)動(dòng)的圖片設(shè)計(jì)工具,在低代碼應(yīng)用開(kāi)發(fā)軟件Power Apps中推出了支持GPT-3的工具,并根據(jù)OpenAI的Codex模型開(kāi)發(fā)了一款代碼建議工具GitHub Copilot。

圖片

(OpenAI CodeX)

Google在推出PaLM Coder代碼大模型的同時(shí),于23年與新晉AI編程獨(dú)角獸 Replit合作,將其人工智能語(yǔ)言模型和Replit的生成式代碼工具Ghostwriter結(jié)合。

Replit由Facebook前軟件工程師Amjad Masad創(chuàng)辦,在打造全球最大的在線IDE(集成開(kāi)發(fā)環(huán)境)后,于2022年11月基于AI大模型技術(shù)推出Ghostwriter,對(duì)標(biāo) GitHub Copilot,擁有代碼自動(dòng)生成和補(bǔ)全、進(jìn)行代碼語(yǔ)言轉(zhuǎn)換、支持代碼解釋和搜索等。

中國(guó)科技巨頭不遑多讓。2022年華為推出代碼大模型Pangu-Coder;23年百度智能云推出“Comate”代碼助手,第一階段的主要功能是“輔助代碼撰寫(xiě)”,此后將在特定領(lǐng)域場(chǎng)景實(shí)現(xiàn)自然語(yǔ)言代碼生成,第三階段將實(shí)現(xiàn)全領(lǐng)域的自然語(yǔ)言開(kāi)發(fā);同一年,螞蟻“百靈大模型家族”迎來(lái)了代碼大模型成員CodeFuse,其源自于螞蟻?身的開(kāi)發(fā)場(chǎng)景及代碼庫(kù)沉淀,基于海量?質(zhì)量代碼數(shù)據(jù)和代碼領(lǐng)域特?詞表,和多任務(wù)微調(diào)技術(shù)MFT,在螞蟻?萬(wàn)多內(nèi)部研發(fā)?員的?常編碼、測(cè)試、運(yùn)維等場(chǎng)景中,經(jīng)過(guò)反復(fù)驗(yàn)證與迭代。去年中,CodeFuse 及其必要的?具鏈,?向技術(shù)社區(qū)開(kāi)源開(kāi)放;10月,CodeFuse推出IDE插件功能,支持多種語(yǔ)言和編程工具。

圖片

(螞蟻CodeFuse)

24年,代碼大模型呈現(xiàn)出百花齊放的態(tài)勢(shì)。在螞蟻CodeFuse推出“圖生代碼”的同一時(shí)期,阿里云迎來(lái)了1號(hào)AI員工“通義靈碼”的上線,其“簡(jiǎn)歷”顯示這是一個(gè)出生于0101世界、無(wú)性別的硅基生命,人格屬于INTJ,職位是AI智能編碼助手,項(xiàng)目經(jīng)歷是“截至2023年4月,下載量超過(guò)200萬(wàn),每天數(shù)百萬(wàn)行代碼被程序員采用。”在4月中旬即將召開(kāi)的百度Create2024大會(huì)上,李彥宏也將發(fā)布AI編程相關(guān)產(chǎn)品更新。

巨頭狂卷大模型,而代碼大模型更是成了兵家必爭(zhēng)之地。

跟一日千里的GPT一樣,21年到現(xiàn)在代碼大模型正在快速升級(jí)。在AI編程上,從最初的行級(jí)代碼補(bǔ)全,升級(jí)到倉(cāng)庫(kù)級(jí)代碼生成,再進(jìn)化到自然語(yǔ)言描述下的代碼生成。在代碼生成外,演進(jìn)出代碼語(yǔ)言轉(zhuǎn)換、代碼解釋和搜索、軟件文檔撰寫(xiě)、智能編程助理等功能,甚至出現(xiàn)了螞蟻提出的“AI賦能全生命周期研發(fā)”這樣的新的研發(fā)范式。

AI編程讓程序員專(zhuān)注于創(chuàng)造,

助力企業(yè)研發(fā)降本增效

編程AI化是計(jì)算進(jìn)化的必然。在通用計(jì)算體系下,摩爾定律早已失效。但讓人始料未及的是,“摩爾定律”卻在AI計(jì)算體系中得以延續(xù)。Open AI CEO、ChatGPT之父Sam Altman指出,每年LLM參數(shù)規(guī)模大小增長(zhǎng)10X,人工智能運(yùn)算量每隔18個(gè)月翻一番,這被稱(chēng)為“AI摩爾定律”。在AI軟件內(nèi)涵突變之時(shí),低效的傳統(tǒng)研發(fā)模式難以為繼,研發(fā)模式的奇點(diǎn)也已到來(lái)。

圖片

(AI摩爾定律)

AI如何改變研發(fā)本身成為業(yè)界關(guān)注的新焦點(diǎn)。紅杉資本則認(rèn)為,生成式AI將逐漸改變各個(gè)行業(yè),但軟件開(kāi)發(fā)模式的轉(zhuǎn)型還沒(méi)完成。紅杉提出了“開(kāi)發(fā)工具2.0”,指出這種“Beyond Copilot”的新形態(tài),尚未被定義。

AI大模型率先改變的都是創(chuàng)造性職業(yè),比如文字、圖片、視頻、音樂(lè)等內(nèi)容的創(chuàng)作均迎來(lái)了各自的現(xiàn)象級(jí)應(yīng)用:ChatGPT、Midjourney、Sora、Suno。如今,AI對(duì)創(chuàng)造的賦能來(lái)到了編程領(lǐng)域,AI編程將是AI大模型技術(shù)的下一個(gè)“殺手锏場(chǎng)景”。

對(duì)科技巨頭來(lái)說(shuō),布局AI編程,既是內(nèi)在研發(fā)提效的剛需,也是布局新興業(yè)務(wù)的必要——這跟云計(jì)算、to B數(shù)字科技“始于內(nèi)、發(fā)于外”的歷程一致。

首先,通用大模型要落地離不開(kāi)“垂直大模型”這一橋梁,而編程則是大模型最有潛力的垂直應(yīng)用場(chǎng)景,大模型與軟件開(kāi)發(fā)工具結(jié)合可顯著解決技術(shù)人員面臨的痛點(diǎn)。

最早大規(guī)模引入AI編程的GitHub平臺(tái)曾在一篇調(diào)研文章中探討了GitHub Copilot對(duì)程序員效率和幸福感的提升,發(fā)現(xiàn)使用工具的程序員完成任務(wù)速度快55%,96%的使用者認(rèn)為自己處理重復(fù)性的工作更快了,88%的使用者認(rèn)為自己可以更加專(zhuān)注于更喜歡的工作上。

百度、阿里云、螞蟻等布局代碼大模型的國(guó)內(nèi)巨頭,也是先嘗到了甜頭。比如在螞蟻內(nèi)部,CodeFuse ?持40多種編程語(yǔ)?,10多個(gè)主流IDE平臺(tái),現(xiàn)在有超過(guò)五成的程序員使用CodeFuse,在這些程序員寫(xiě)的代碼里,AI生成代碼占比超過(guò)了10%,整體采納率30%,在生成單元測(cè)試場(chǎng)景采納率可達(dá)到 60%。以最新發(fā)布的“圖生代碼”技術(shù)為例,前端工程師在還原一個(gè)中型網(wǎng)頁(yè)時(shí),如果最終有200 行代碼,一人耗時(shí)約需1小時(shí),使用CodeFuse一鍵生成后,只需檢查與調(diào)整,這大幅提高了前端工程師的效率。

圖片

(CodeFuse正在成為越來(lái)越多程序員的編程工具)

其次,編程人員群體龐大,研發(fā)提效是科技巨頭高質(zhì)量增長(zhǎng)的關(guān)鍵一環(huán)。

以中國(guó)為例,來(lái)自Boss直聘的《2023年中國(guó)程序員人才發(fā)展報(bào)告》顯示,中國(guó)程序員總數(shù)約為600萬(wàn)人左右。如果算上需求分析師、設(shè)計(jì)師、UI/UE/UX、產(chǎn)品經(jīng)理、IT運(yùn)維等研發(fā)上下游工種,IT研發(fā)人才群體更加龐大。

大量的研發(fā)人才意味著龐大的研發(fā)支出,這從頭部互聯(lián)網(wǎng)企業(yè)的研發(fā)成本可以窺見(jiàn),李彥宏日前表示,百度這么多年研發(fā)費(fèi)用占到收入的比重一直是20%以上,以23年1345.98億元營(yíng)收計(jì)算,研發(fā)投入在270億左右。阿里、騰訊、字節(jié)、華為等巨頭的研發(fā)投入規(guī)模更大,且相當(dāng)部分均在軟件研發(fā)上。

哪怕代碼大模型可提高1%的研發(fā)效率(當(dāng)然,從實(shí)踐來(lái)看提效遠(yuǎn)不止1%),對(duì)科技巨頭降本增效也有非凡意義——高質(zhì)量增長(zhǎng)是科技行業(yè)的主旋律,降本增效是每家公司的重點(diǎn)。正因?yàn)榇,所有科技企業(yè)都將推動(dòng)所有軟件工程師使用AI編程工具。

最后,程序員以及研發(fā)人員具有更強(qiáng)的“AI基礎(chǔ)素養(yǎng)”,更樂(lè)意利用、更可能用好AI編程輔助工具。

對(duì)于非技術(shù)類(lèi)人員來(lái)說(shuō),即便是使用ChatGPT這樣的大眾化工具,也需要學(xué)習(xí)“Prompt(提示詞)”等技能,可見(jiàn)真正使用AI大模型來(lái)創(chuàng)作對(duì)大多數(shù)人來(lái)說(shuō)是有門(mén)檻的,且普通人無(wú)法適應(yīng)當(dāng)前大模型技術(shù)結(jié)果的不確定性、不可靠。

對(duì)技術(shù)人才來(lái)說(shuō),以上問(wèn)題不存在,因?yàn)樗麄兪亲钌朴谑褂霉ぞ摺⒁矘?lè)于探索新工具的人群。程序員是“終身學(xué)習(xí)職業(yè)”職業(yè),他們一直在學(xué)習(xí)更先進(jìn)的編程語(yǔ)言、尋覓更先進(jìn)的工具、應(yīng)用最先進(jìn)的方法來(lái)提高工作效率與質(zhì)量。在代碼大模型驅(qū)動(dòng)下,AI編程工具如雨后春筍出現(xiàn),對(duì)應(yīng)的研發(fā)體系、協(xié)作流程、管理方法、設(shè)計(jì)模式都將劇變,就算企業(yè)不推動(dòng),研發(fā)人員也會(huì)自主去探索和學(xué)習(xí)AI研發(fā)工具。

圖片

(CodeFuse IDE插件的代碼生成功能(部分))

Gartner發(fā)布的2024年十大戰(zhàn)略技術(shù)趨勢(shì)也指出:到2028年,75%的企業(yè)軟件工程師將使用AI編程助手。放眼未來(lái),在助力企業(yè)研發(fā)板塊“降本增效”的同時(shí),代碼大模型將更大程度地解放技術(shù)人員,讓他們專(zhuān)注于更高維度的創(chuàng)造工作。

AI編程進(jìn)階:

從協(xié)助寫(xiě)代碼到重構(gòu)研發(fā)范式

從當(dāng)前的AI編程實(shí)踐來(lái)看,代碼大模型正沿著兩個(gè)方向演進(jìn)。

一條路是不斷提高代碼生成能力,做好程序員編程智能輔助工具。代碼生成、補(bǔ)全、解釋與轉(zhuǎn)換能力,從行級(jí)到片段到倉(cāng)庫(kù)級(jí)不斷進(jìn)化。在生成代碼時(shí),支持多輪對(duì)話式需求理解,支持自然語(yǔ)言、語(yǔ)音、圖生代碼等多模態(tài)指令理解,這也是包括GitHub Copilot在內(nèi)的AI編程平臺(tái)在主攻的方向,它們基于云提供SaaS服務(wù)或插件工具,著重于助力程序員提高代碼編寫(xiě)的效率和質(zhì)量。

另一條路則是讓AI滲透到研發(fā)的全生命周期,重構(gòu)研發(fā)體系。

軟件開(kāi)發(fā)涉及到需求分析、編程開(kāi)發(fā)、測(cè)試與構(gòu)建、發(fā)布與運(yùn)維、數(shù)據(jù)洞察等鏈路。每一個(gè)鏈路都需要使用大量的專(zhuān)業(yè)工具,且與上下游研發(fā)鏈路進(jìn)行協(xié)作。理論上來(lái)說(shuō),所有研發(fā)工具都可以被AI重做一遍,軟件研發(fā)范式(包括工具鏈、協(xié)作流程、項(xiàng)目管理方法、設(shè)計(jì)模式等等)都將被重構(gòu)。

在國(guó)內(nèi),螞蟻CodeFuse 是AI全?命周期研發(fā)的首倡者和積極探索者。在內(nèi)部,螞蟻已將?模型技術(shù)應(yīng)?在研發(fā)的全鏈路環(huán)節(jié),在CodeFuse的版圖中,在需求階段,Project Copilot提供多場(chǎng)景開(kāi)發(fā)助手,提供需求/設(shè)計(jì)文檔智能生成等服務(wù);在開(kāi)發(fā)、測(cè)試、運(yùn)維和數(shù)據(jù)環(huán)節(jié),分別提供Code Copilot(IDE插件)、Test Copilot、Ops Copilot、Data Copilot等AI研發(fā)工具,大幅提高對(duì)應(yīng)環(huán)節(jié)研發(fā)人員的工作效率。CodeFuse 在螞蟻內(nèi)部被大規(guī)模應(yīng)用在工業(yè)化生產(chǎn)場(chǎng)景,經(jīng)過(guò)反復(fù)驗(yàn)證與迭代后再以開(kāi)發(fā)助手、IDE插件、AI Native IDE、Open API、開(kāi)源等形式開(kāi)放給行業(yè),同時(shí)也針對(duì)小程序開(kāi)發(fā)等特殊場(chǎng)景定制了AIGC方案。

圖片

(螞蟻CodeFuse探索AI全?命周期研發(fā)范式)

第二種路線可被簡(jiǎn)單地理解成企業(yè)研發(fā)的數(shù)智化升級(jí),這將是科技類(lèi)企業(yè)數(shù)智能升級(jí)中不容忽視的一環(huán)。自動(dòng)駕駛技術(shù)不只是改變了車(chē)輛駕駛方式,也將重構(gòu)出行、物流、道路、交管、法規(guī)等交通體系。同理,AI大模型不只是會(huì)提升程序員個(gè)體的工作效率,也將締造全新的研發(fā)范式。大部分的AI編程工具強(qiáng)調(diào)通用性,不大可能面向前端工程師提供“圖生代碼”這樣的細(xì)化服務(wù),因此目前更多是影響個(gè)人開(kāi)發(fā)者。但在AI大模型重構(gòu)研發(fā)體系時(shí),開(kāi)發(fā)團(tuán)隊(duì)更需要去做全生命周期的AI研發(fā)的頂層布局,在每一個(gè)鏈路中使用AI研發(fā)工具且采取全新的協(xié)作模式、管理方法。

AI研發(fā)勢(shì)不可擋,

IT技術(shù)人員何去何從?

回到開(kāi)篇的問(wèn)題:編程到底會(huì)不會(huì)消亡?

看上去,隨著AI編程技術(shù)的發(fā)展,人人都可用自然語(yǔ)言來(lái)編程,程序員確實(shí)將成為不復(fù)存在的職業(yè)。

但事實(shí)并非如此。

一方面,程序員的核心價(jià)值是“創(chuàng)造”,創(chuàng)造本身不可能被機(jī)器取代。自然語(yǔ)言編程只是降低了編程的“交互門(mén)檻”,但編程的根本是抽象思維、邏輯思維、系統(tǒng)思維、算法思維以及創(chuàng)造思維,特別是對(duì)物理世界的認(rèn)知、理解與抽象,這些并非AI所長(zhǎng)。

另一方面,產(chǎn)品研發(fā)不只是編程。正如前文所言,研發(fā)涉及到需求分析等等環(huán)節(jié),同時(shí)需要與產(chǎn)品運(yùn)營(yíng)、市場(chǎng)推廣、商業(yè)化等環(huán)節(jié)密切配合,這些更是AI不可能做好的事情,比如AI就不可能洞察到用戶有在手機(jī)上收發(fā)紅包這樣的細(xì)微需求,更不可能做出網(wǎng)絡(luò)紅包這樣的創(chuàng)新產(chǎn)品——當(dāng)然,有了AI編程工具,網(wǎng)絡(luò)紅包的開(kāi)發(fā)會(huì)更敏捷,更高效。螞蟻“2024支付寶五福節(jié)”的游戲中心項(xiàng)目代碼,就有30%由AI提交。

受過(guò)軟件開(kāi)發(fā)專(zhuān)業(yè)訓(xùn)練的人都知道,編程不等于寫(xiě)代碼,項(xiàng)目管理、軟件測(cè)試、需求分析、算法、數(shù)據(jù)結(jié)構(gòu)等等全鏈路研發(fā)技能也是所有計(jì)算機(jī)軟件類(lèi)專(zhuān)業(yè)的必修課。正因?yàn)榇,技術(shù)人員要盡可能地用好AI編程工具提升個(gè)體工作效率,同時(shí)增強(qiáng)復(fù)合型能力,當(dāng)重復(fù)性等工作大幅減少可用更多時(shí)間“創(chuàng)造”,強(qiáng)化用戶需求分析、創(chuàng)意設(shè)計(jì)、業(yè)務(wù)理解、項(xiàng)目管理等能力。

正如螞蟻集團(tuán)CodeFuse負(fù)責(zé)人所言:“AI的普及不僅可以減少開(kāi)發(fā)人員的工作壓力,讓他們有更多精力投入到更有創(chuàng)造力的工作中去。”而AI研發(fā)范式的變革,并不代表“人”在研發(fā)場(chǎng)景的角色會(huì)消失,反而對(duì)AI和人如何協(xié)同提出了更高的要求。“AI目前主要集中在輔助編程(code copilot),編程要從copilot走向co-worker,甚至替代人,還有很多未解決的問(wèn)題,而整個(gè)研發(fā)生命周期的AI自動(dòng)化,還有很長(zhǎng)的路要走。”

AI不會(huì)取代任何舊的職業(yè),但會(huì)淘汰思維陳舊的人。長(zhǎng)期來(lái)看,AI將成為人類(lèi)的助手,?機(jī)協(xié)同是AI發(fā)展的終局,這一點(diǎn)會(huì)在研發(fā)特別是編程場(chǎng)景率先體現(xiàn)。對(duì)于企業(yè)來(lái)說(shuō),研發(fā)是根基,其本質(zhì)是用技術(shù)解決問(wèn)題和創(chuàng)造產(chǎn)品,這將是硅基文明基礎(chǔ)生產(chǎn)方式。2024年的一個(gè)顯著趨勢(shì)是,編程以及研發(fā)本身,正在被AI大模型技術(shù)重構(gòu)。所有技術(shù)人員必須擁抱AI研發(fā)的全新理念,適應(yīng)新的研發(fā)協(xié)作模式。

是時(shí)候重新出發(fā)了。

       原文標(biāo)題 : 巨頭狂卷代碼大模型

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)