国产一区二区三区欧美,久久国产精品99久久久久久老狼

對(duì)話(huà)多位相關(guān)從業(yè)人士，AIGC監(jiān)管迎來(lái)新時(shí)代？

2023-08-01 16:14

2023年7月13日，國(guó)家互聯(lián)網(wǎng)信息辦公室等七部門(mén)聯(lián)合發(fā)布《生成式人工智能服務(wù)管理暫行辦法》（以下簡(jiǎn)稱(chēng)“《辦法》”）。

《辦法》針對(duì)從去年起成為科技圈頂流的生成式人工智能行業(yè)提出了監(jiān)管辦法。

2022年11月，ChatGPT發(fā)布之后，生成式人工智能迅速席卷整個(gè)互聯(lián)網(wǎng)行業(yè)。各大互聯(lián)網(wǎng)企業(yè)紛紛入局，截至目前，國(guó)內(nèi)發(fā)布的10億參數(shù)規(guī)模以上的大模型就有超過(guò)100個(gè)，應(yīng)用領(lǐng)域涵蓋搜索、對(duì)話(huà)、協(xié)助創(chuàng)作、媒體生成、教育、翻譯等。

艾媒咨詢(xún)預(yù)測(cè)，預(yù)計(jì)2023年中國(guó)AIGC核心市場(chǎng)規(guī)模將達(dá)79.3億元，2028年將達(dá)2767.4億元。

但自從ChatGPT一夜爆紅以來(lái)，由人工智能生成的虛假和錯(cuò)誤信息屢見(jiàn)不鮮。同時(shí)生成式人工智能的出現(xiàn)，也嚴(yán)重沖擊了創(chuàng)作領(lǐng)域原有的生態(tài)，版權(quán)問(wèn)題也讓全世界的立法機(jī)構(gòu)也陷入了難題。

《辦法》的出臺(tái)會(huì)解決這些問(wèn)題嗎？對(duì)生成式人工智能行業(yè)有什么樣的影響？業(yè)內(nèi)如何看待此次《辦法》的出臺(tái)？

《銀杏科技》對(duì)話(huà)了多位相關(guān)從業(yè)人士，他們分別是高級(jí)算法工程師、自然語(yǔ)言處理高級(jí)研究員孫科、連續(xù)創(chuàng)業(yè)者譚偉、偉君律師事務(wù)所律師錢(qián)川。

他們表示，《辦法》的出臺(tái)一方面降低訓(xùn)練模型的門(mén)檻，促進(jìn)了行業(yè)創(chuàng)新，同時(shí)還明確了算法的安全主體責(zé)任，要求企業(yè)在應(yīng)用開(kāi)發(fā)期間就針對(duì)算法進(jìn)行安全評(píng)估。

對(duì)于“裸奔”了數(shù)個(gè)月的生成式人工智能行業(yè)來(lái)說(shuō)，《辦法》出臺(tái)意味著行業(yè)將迎來(lái)一個(gè)全新的發(fā)展階段。

以下為部分對(duì)話(huà)實(shí)錄：

問(wèn)：對(duì)于開(kāi)發(fā)者來(lái)說(shuō)，《辦法》的出臺(tái)有什么樣的影響？

孫科：《辦法》出臺(tái)之后，企業(yè)在開(kāi)發(fā)產(chǎn)品的過(guò)程中需要提前做好規(guī)劃以應(yīng)對(duì)生成式人工智能產(chǎn)品較長(zhǎng)的開(kāi)發(fā)流程和更多的合規(guī)控制點(diǎn)。

如果只是做ChatGPT這樣的聊天應(yīng)用，除了算法備案之外，還需要遵守《網(wǎng)絡(luò)安全法》、《數(shù)據(jù)安全法》、《個(gè)人信息保護(hù)法》等多項(xiàng)法規(guī)，此外還需要ICP經(jīng)營(yíng)許可證、軟件著作權(quán)、網(wǎng)絡(luò)文化經(jīng)營(yíng)許可證、增值電信業(yè)務(wù)經(jīng)營(yíng)許可證等審批，如果要在其他領(lǐng)域還需要完成相應(yīng)的許可和備案。

生成式人工智能的開(kāi)發(fā)涉及到多個(gè)不同的環(huán)節(jié)，企業(yè)內(nèi)部也需要對(duì)相應(yīng)的環(huán)節(jié)進(jìn)行規(guī)劃以滿(mǎn)足合規(guī)要求。

問(wèn)：《辦法》為什么要求將算法備案？具體要備案哪些信息？

孫科：算法備案制度本質(zhì)是監(jiān)管部門(mén)事前設(shè)置算法問(wèn)責(zé)的問(wèn)責(zé)點(diǎn)，用以確認(rèn)算法推薦服務(wù)提供者是否履行了法律規(guī)定的各項(xiàng)義務(wù)，是否在算法的設(shè)計(jì)、運(yùn)行和結(jié)果輸出層面有主觀(guān)過(guò)錯(cuò)。

在具體實(shí)施上可能也會(huì)采取與推薦算法、深度合成算法類(lèi)似的“大廠(chǎng)先行”模式，由互聯(lián)網(wǎng)大廠(chǎng)率先普及。生成式人工智能算法備案可能也并不需要公開(kāi)算法機(jī)制，但同一App，甚至同一應(yīng)用場(chǎng)景下的不同算法需要分別進(jìn)行備案。

雖然在《辦法》中沒(méi)有明確細(xì)則，但參考此前的經(jīng)驗(yàn)，企業(yè)需要將名稱(chēng)、服務(wù)形式、應(yīng)用領(lǐng)域、算法類(lèi)型、算法自評(píng)估報(bào)告、擬公示內(nèi)容等信息進(jìn)行備案，向監(jiān)管主體提示算法可能存在的濫用、惡意利用、漏洞、違法和不良信息生成、傳播等違法違規(guī)的風(fēng)險(xiǎn)，并在服務(wù)網(wǎng)站和程序頁(yè)面上注明備案號(hào)和公示鏈接。

另外，生成的內(nèi)容也需要進(jìn)行標(biāo)注。

問(wèn)：對(duì)于創(chuàng)業(yè)者，《辦法》的出臺(tái)會(huì)帶來(lái)什么樣的新機(jī)遇嗎？

譚偉：創(chuàng)業(yè)者可以將大模型必備的大量計(jì)算和數(shù)據(jù)資源成本降低不少�！掇k法》提出，將推動(dòng)生成式人工智能基礎(chǔ)設(shè)施和公共訓(xùn)練數(shù)據(jù)資源平臺(tái)建設(shè)、促進(jìn)算力資源協(xié)同共享，提升算力資源利用效能。推動(dòng)公共數(shù)據(jù)分類(lèi)分級(jí)有序開(kāi)放，擴(kuò)展高質(zhì)量的公共訓(xùn)練數(shù)據(jù)資源。

和其他領(lǐng)域相比，人工智能，尤其是大模型生成式人工智能領(lǐng)域完全是一個(gè)重資產(chǎn)行業(yè)，沒(méi)有算力、沒(méi)有數(shù)據(jù)就沒(méi)有產(chǎn)品。

以目前行業(yè)內(nèi)較為熱門(mén)的開(kāi)源大數(shù)據(jù)模型BLOOM為例，這個(gè)高達(dá)1760億參數(shù)的大模型的訓(xùn)練需要使用384個(gè)GPU，將花費(fèi)3.5個(gè)月時(shí)間，僅硬件成本就高達(dá)576萬(wàn)美元。如果將訓(xùn)練時(shí)間縮短至24天，則需要1024個(gè)GPU，硬件成本超過(guò)1530萬(wàn)美元。

《辦法》的出臺(tái)一方面能夠降低計(jì)算和數(shù)據(jù)成本，另一方面利好共享算力服務(wù)提供商。

問(wèn)：您的創(chuàng)業(yè)項(xiàng)目針對(duì)的是大模型的算力基礎(chǔ)設(shè)施，《辦法》會(huì)帶來(lái)什么樣的影響？

譚偉：對(duì)于大模型創(chuàng)業(yè)企業(yè)，硬件成本就能勸退大多數(shù)團(tuán)隊(duì)了。我計(jì)劃組建一個(gè)類(lèi)似于Folding@home的分布式計(jì)算網(wǎng)絡(luò)來(lái)支持大模型的訓(xùn)練。

這是世界上最大的分布式計(jì)算項(xiàng)目，針對(duì)分子生物領(lǐng)域進(jìn)行計(jì)算，它并不依靠強(qiáng)大的超級(jí)計(jì)算機(jī)進(jìn)行計(jì)算，主要的貢獻(xiàn)者是成千上萬(wàn)的個(gè)人電腦和游戲機(jī)。

每部參與的電腦都安裝了一個(gè)在后臺(tái)運(yùn)行的客戶(hù)端程序，在系統(tǒng)不忙碌的時(shí)候調(diào)用中央處理器運(yùn)行模擬工作。現(xiàn)時(shí)世界上絕大部分的個(gè)人電腦，在一般的情況下都很少用盡本身的計(jì)算能力。

Folding@home就是使用這些本來(lái)都浪費(fèi)了的運(yùn)算力量。Folding@home是第一臺(tái)千萬(wàn)億次級(jí)計(jì)算機(jī)，每秒能夠執(zhí)行一百萬(wàn)億次運(yùn)算，最近還成為了第一臺(tái)超大規(guī)模計(jì)算機(jī)，每秒可執(zhí)行十億億次運(yùn)算。

類(lèi)似的分布式計(jì)算項(xiàng)目其實(shí)不少，但針對(duì)大模型訓(xùn)練的并不多，《辦法》的出臺(tái)是一個(gè)入局的好機(jī)會(huì)。

問(wèn)：為什么《辦法》并沒(méi)有強(qiáng)調(diào)生成式人工智能涉及到的版權(quán)問(wèn)題？生成作品的知識(shí)產(chǎn)權(quán)應(yīng)該歸屬于誰(shuí)？

錢(qián)川：《辦法》并未在知識(shí)產(chǎn)權(quán)方面對(duì)生成式人工智能進(jìn)行過(guò)多限制，還是希望能夠鼓勵(lì)企業(yè)在該領(lǐng)域的創(chuàng)新，開(kāi)發(fā)出自主可控的生成式人工智能產(chǎn)品，避免“不管就亂，一管就死”。

就目前情況而言，生成作品的知識(shí)產(chǎn)權(quán)問(wèn)題暫時(shí)沒(méi)有一個(gè)完善的解決方案。大多數(shù)國(guó)家依然按照以往的規(guī)定來(lái)界定生成作品的版權(quán)。

著作權(quán)法意義上的作品應(yīng)滿(mǎn)足以下四個(gè)條件：由人類(lèi)創(chuàng)作，具有獨(dú)創(chuàng)性，是蘊(yùn)含一定思想內(nèi)容的表達(dá)形式，且不屬于法律法規(guī)、通用數(shù)表、公式等著作權(quán)法排除對(duì)象。

完全由人工智能獨(dú)立創(chuàng)作或按照自然人輸入的提示詞生成的作品，是無(wú)法在法律上被稱(chēng)為 “作品”的。人工智能并未被界定為人類(lèi)，不享有人權(quán)，當(dāng)然也不擁有版權(quán)，更不用說(shuō)歸屬與誰(shuí)了。

問(wèn)：訓(xùn)練人工智能時(shí)使用了他人公開(kāi)在互聯(lián)網(wǎng)上的作品，創(chuàng)造出AI孫燕姿、AI畢加索，此類(lèi)行為是否侵犯了知識(shí)產(chǎn)權(quán)？

錢(qián)川：訓(xùn)練人工智能使用的數(shù)據(jù)知識(shí)產(chǎn)權(quán)保護(hù)暫時(shí)沒(méi)有成功案例。目前只有具有數(shù)據(jù)產(chǎn)權(quán)的數(shù)據(jù)庫(kù)可能會(huì)受到保護(hù)。

一方面，數(shù)據(jù)產(chǎn)權(quán)的保護(hù)辦法我們還在探索當(dāng)中，今年年初的數(shù)據(jù)二十條規(guī)定就是一個(gè)初步的方案。另一方面，目前國(guó)家知識(shí)產(chǎn)權(quán)局和深圳、上海已經(jīng)開(kāi)始研究數(shù)據(jù)的確權(quán)工作，但具體如何確權(quán)還需實(shí)踐。

原文標(biāo)題 : 對(duì)話(huà)多位相關(guān)從業(yè)人士，AIGC監(jiān)管迎來(lái)新時(shí)代？