訂閱
糾錯(cuò)
加入自媒體

對(duì)話(huà)多位相關(guān)從業(yè)人士,AIGC監(jiān)管迎來(lái)新時(shí)代?

2023年7月13日,國(guó)家互聯(lián)網(wǎng)信息辦公室等七部門(mén)聯(lián)合發(fā)布《生成式人工智能服務(wù)管理暫行辦法》(以下簡(jiǎn)稱(chēng)“《辦法》”)。

《辦法》針對(duì)從去年起成為科技圈頂流的生成式人工智能行業(yè)提出了監(jiān)管辦法。

2022年11月,ChatGPT發(fā)布之后,生成式人工智能迅速席卷整個(gè)互聯(lián)網(wǎng)行業(yè)。各大互聯(lián)網(wǎng)企業(yè)紛紛入局,截至目前,國(guó)內(nèi)發(fā)布的10億參數(shù)規(guī)模以上的大模型就有超過(guò)100個(gè),應(yīng)用領(lǐng)域涵蓋搜索、對(duì)話(huà)、協(xié)助創(chuàng)作、媒體生成、教育、翻譯等。

艾媒咨詢(xún)預(yù)測(cè),預(yù)計(jì)2023年中國(guó)AIGC核心市場(chǎng)規(guī)模將達(dá)79.3億元,2028年將達(dá)2767.4億元。

但自從ChatGPT一夜爆紅以來(lái),由人工智能生成的虛假和錯(cuò)誤信息屢見(jiàn)不鮮。同時(shí)生成式人工智能的出現(xiàn),也嚴(yán)重沖擊了創(chuàng)作領(lǐng)域原有的生態(tài),版權(quán)問(wèn)題也讓全世界的立法機(jī)構(gòu)也陷入了難題。

《辦法》的出臺(tái)會(huì)解決這些問(wèn)題嗎?對(duì)生成式人工智能行業(yè)有什么樣的影響?業(yè)內(nèi)如何看待此次《辦法》的出臺(tái)?

《銀杏科技》對(duì)話(huà)了多位相關(guān)從業(yè)人士,他們分別是高級(jí)算法工程師、自然語(yǔ)言處理高級(jí)研究員孫科、連續(xù)創(chuàng)業(yè)者譚偉、偉君律師事務(wù)所律師錢(qián)川。

他們表示,《辦法》的出臺(tái)一方面降低訓(xùn)練模型的門(mén)檻,促進(jìn)了行業(yè)創(chuàng)新,同時(shí)還明確了算法的安全主體責(zé)任,要求企業(yè)在應(yīng)用開(kāi)發(fā)期間就針對(duì)算法進(jìn)行安全評(píng)估。

對(duì)于“裸奔”了數(shù)個(gè)月的生成式人工智能行業(yè)來(lái)說(shuō),《辦法》出臺(tái)意味著行業(yè)將迎來(lái)一個(gè)全新的發(fā)展階段。

以下為部分對(duì)話(huà)實(shí)錄:

問(wèn):對(duì)于開(kāi)發(fā)者來(lái)說(shuō),《辦法》的出臺(tái)有什么樣的影響?

孫科:《辦法》出臺(tái)之后,企業(yè)在開(kāi)發(fā)產(chǎn)品的過(guò)程中需要提前做好規(guī)劃以應(yīng)對(duì)生成式人工智能產(chǎn)品較長(zhǎng)的開(kāi)發(fā)流程和更多的合規(guī)控制點(diǎn)。

如果只是做ChatGPT這樣的聊天應(yīng)用,除了算法備案之外,還需要遵守《網(wǎng)絡(luò)安全法》、《數(shù)據(jù)安全法》、《個(gè)人信息保護(hù)法》等多項(xiàng)法規(guī),此外還需要ICP經(jīng)營(yíng)許可證、軟件著作權(quán)、網(wǎng)絡(luò)文化經(jīng)營(yíng)許可證、增值電信業(yè)務(wù)經(jīng)營(yíng)許可證等審批,如果要在其他領(lǐng)域還需要完成相應(yīng)的許可和備案。

生成式人工智能的開(kāi)發(fā)涉及到多個(gè)不同的環(huán)節(jié),企業(yè)內(nèi)部也需要對(duì)相應(yīng)的環(huán)節(jié)進(jìn)行規(guī)劃以滿(mǎn)足合規(guī)要求。

問(wèn):《辦法》為什么要求將算法備案?具體要備案哪些信息?

孫科:算法備案制度本質(zhì)是監(jiān)管部門(mén)事前設(shè)置算法問(wèn)責(zé)的問(wèn)責(zé)點(diǎn),用以確認(rèn)算法推薦服務(wù)提供者是否履行了法律規(guī)定的各項(xiàng)義務(wù),是否在算法的設(shè)計(jì)、運(yùn)行和結(jié)果輸出層面有主觀(guān)過(guò)錯(cuò)。

在具體實(shí)施上可能也會(huì)采取與推薦算法、深度合成算法類(lèi)似的“大廠(chǎng)先行”模式,由互聯(lián)網(wǎng)大廠(chǎng)率先普及。生成式人工智能算法備案可能也并不需要公開(kāi)算法機(jī)制,但同一App,甚至同一應(yīng)用場(chǎng)景下的不同算法需要分別進(jìn)行備案。

雖然在《辦法》中沒(méi)有明確細(xì)則,但參考此前的經(jīng)驗(yàn),企業(yè)需要將名稱(chēng)、服務(wù)形式、應(yīng)用領(lǐng)域、算法類(lèi)型、算法自評(píng)估報(bào)告、擬公示內(nèi)容等信息進(jìn)行備案,向監(jiān)管主體提示算法可能存在的濫用、惡意利用、漏洞、違法和不良信息生成、傳播等違法違規(guī)的風(fēng)險(xiǎn),并在服務(wù)網(wǎng)站和程序頁(yè)面上注明備案號(hào)和公示鏈接。

另外,生成的內(nèi)容也需要進(jìn)行標(biāo)注。

問(wèn):對(duì)于創(chuàng)業(yè)者,《辦法》的出臺(tái)會(huì)帶來(lái)什么樣的新機(jī)遇嗎?

譚偉:創(chuàng)業(yè)者可以將大模型必備的大量計(jì)算和數(shù)據(jù)資源成本降低不少!掇k法》提出,將推動(dòng)生成式人工智能基礎(chǔ)設(shè)施和公共訓(xùn)練數(shù)據(jù)資源平臺(tái)建設(shè)、促進(jìn)算力資源協(xié)同共享,提升算力資源利用效能。推動(dòng)公共數(shù)據(jù)分類(lèi)分級(jí)有序開(kāi)放,擴(kuò)展高質(zhì)量的公共訓(xùn)練數(shù)據(jù)資源。

和其他領(lǐng)域相比,人工智能,尤其是大模型生成式人工智能領(lǐng)域完全是一個(gè)重資產(chǎn)行業(yè),沒(méi)有算力、沒(méi)有數(shù)據(jù)就沒(méi)有產(chǎn)品。

以目前行業(yè)內(nèi)較為熱門(mén)的開(kāi)源大數(shù)據(jù)模型BLOOM為例,這個(gè)高達(dá)1760億參數(shù)的大模型的訓(xùn)練需要使用384個(gè)GPU,將花費(fèi)3.5個(gè)月時(shí)間,僅硬件成本就高達(dá)576萬(wàn)美元。如果將訓(xùn)練時(shí)間縮短至24天,則需要1024個(gè)GPU,硬件成本超過(guò)1530萬(wàn)美元。

《辦法》的出臺(tái)一方面能夠降低計(jì)算和數(shù)據(jù)成本,另一方面利好共享算力服務(wù)提供商。

問(wèn):您的創(chuàng)業(yè)項(xiàng)目針對(duì)的是大模型的算力基礎(chǔ)設(shè)施,《辦法》會(huì)帶來(lái)什么樣的影響?

譚偉:對(duì)于大模型創(chuàng)業(yè)企業(yè),硬件成本就能勸退大多數(shù)團(tuán)隊(duì)了。我計(jì)劃組建一個(gè)類(lèi)似于Folding@home的分布式計(jì)算網(wǎng)絡(luò)來(lái)支持大模型的訓(xùn)練。

這是世界上最大的分布式計(jì)算項(xiàng)目,針對(duì)分子生物領(lǐng)域進(jìn)行計(jì)算,它并不依靠強(qiáng)大的超級(jí)計(jì)算機(jī)進(jìn)行計(jì)算,主要的貢獻(xiàn)者是成千上萬(wàn)的個(gè)人電腦和游戲機(jī)。

每部參與的電腦都安裝了一個(gè)在后臺(tái)運(yùn)行的客戶(hù)端程序,在系統(tǒng)不忙碌的時(shí)候調(diào)用中央處理器運(yùn)行模擬工作。現(xiàn)時(shí)世界上絕大部分的個(gè)人電腦,在一般的情況下都很少用盡本身的計(jì)算能力。

Folding@home就是使用這些本來(lái)都浪費(fèi)了的運(yùn)算力量。Folding@home是第一臺(tái)千萬(wàn)億次級(jí)計(jì)算機(jī),每秒能夠執(zhí)行一百萬(wàn)億次運(yùn)算,最近還成為了第一臺(tái)超大規(guī)模計(jì)算機(jī),每秒可執(zhí)行十億億次運(yùn)算。

類(lèi)似的分布式計(jì)算項(xiàng)目其實(shí)不少,但針對(duì)大模型訓(xùn)練的并不多,《辦法》的出臺(tái)是一個(gè)入局的好機(jī)會(huì)。

問(wèn):為什么《辦法》并沒(méi)有強(qiáng)調(diào)生成式人工智能涉及到的版權(quán)問(wèn)題?生成作品的知識(shí)產(chǎn)權(quán)應(yīng)該歸屬于誰(shuí)?

錢(qián)川:《辦法》并未在知識(shí)產(chǎn)權(quán)方面對(duì)生成式人工智能進(jìn)行過(guò)多限制,還是希望能夠鼓勵(lì)企業(yè)在該領(lǐng)域的創(chuàng)新,開(kāi)發(fā)出自主可控的生成式人工智能產(chǎn)品,避免“不管就亂,一管就死”。

就目前情況而言,生成作品的知識(shí)產(chǎn)權(quán)問(wèn)題暫時(shí)沒(méi)有一個(gè)完善的解決方案。大多數(shù)國(guó)家依然按照以往的規(guī)定來(lái)界定生成作品的版權(quán)。

著作權(quán)法意義上的作品應(yīng)滿(mǎn)足以下四個(gè)條件:由人類(lèi)創(chuàng)作,具有獨(dú)創(chuàng)性,是蘊(yùn)含一定思想內(nèi)容的表達(dá)形式,且不屬于法律法規(guī)、通用數(shù)表、公式等著作權(quán)法排除對(duì)象。

完全由人工智能獨(dú)立創(chuàng)作或按照自然人輸入的提示詞生成的作品,是無(wú)法在法律上被稱(chēng)為 “作品”的。人工智能并未被界定為人類(lèi),不享有人權(quán),當(dāng)然也不擁有版權(quán),更不用說(shuō)歸屬與誰(shuí)了。

問(wèn):訓(xùn)練人工智能時(shí)使用了他人公開(kāi)在互聯(lián)網(wǎng)上的作品,創(chuàng)造出AI孫燕姿、AI畢加索,此類(lèi)行為是否侵犯了知識(shí)產(chǎn)權(quán)?

錢(qián)川:訓(xùn)練人工智能使用的數(shù)據(jù)知識(shí)產(chǎn)權(quán)保護(hù)暫時(shí)沒(méi)有成功案例。目前只有具有數(shù)據(jù)產(chǎn)權(quán)的數(shù)據(jù)庫(kù)可能會(huì)受到保護(hù)。

一方面,數(shù)據(jù)產(chǎn)權(quán)的保護(hù)辦法我們還在探索當(dāng)中,今年年初的數(shù)據(jù)二十條規(guī)定就是一個(gè)初步的方案。另一方面,目前國(guó)家知識(shí)產(chǎn)權(quán)局和深圳、上海已經(jīng)開(kāi)始研究數(shù)據(jù)的確權(quán)工作,但具體如何確權(quán)還需實(shí)踐。

       原文標(biāo)題 : 對(duì)話(huà)多位相關(guān)從業(yè)人士,AIGC監(jiān)管迎來(lái)新時(shí)代?

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀(guān)點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)