人妻综合一区二区三区,亚洲凤凰av免费观看,国产精品视频一区二区三区

數(shù)億網(wǎng)民數(shù)據(jù)將被用來訓(xùn)練AI？谷歌新隱私政策引發(fā)爭議！

2023-07-11 14:25

彼之砒霜，我之蜜糖。

從ChatGPT出現(xiàn)到目前為止，大大小小的大模型一只手已經(jīng)數(shù)不過來了。不管這些模型參數(shù)規(guī)模大小，上察天文，下曉地理，總能找出來一個符合應(yīng)用場景的。這樣的“外掛”說成是解放生產(chǎn)力，也不算為過。

但一家歡喜一家愁。在大模型一路狂奔的背后，那些支持他們訓(xùn)練的數(shù)據(jù)來源，也成了業(yè)內(nèi)心頭一直放不下的障礙。鑒于OpenAI、谷歌等一眾巨頭一直以來“白嫖”的優(yōu)良傳統(tǒng)，各個數(shù)據(jù)源頭如Twitter、Reddit等知名社交平臺和社區(qū)，都表示：想用我的數(shù)據(jù)可以，把錢拿來！

這下AI巨頭們反倒被數(shù)據(jù)源牽著鼻子走了，但是有人偏偏不信這個邪。

近日，搜索引擎巨頭谷歌宣布：以后只要是發(fā)布在網(wǎng)上的信息，谷歌都可以拿來訓(xùn)練AI！不管是語言模型，只要是和AI相關(guān)的服務(wù)，都在允許范圍內(nèi)。

谷歌新政策一出，業(yè)內(nèi)徹底炸開了鍋！

堂而皇之“侵犯隱私”，還能合規(guī)合法？

AI訓(xùn)練“侵犯隱私”的輿論正鬧得沸沸揚揚，谷歌卻頭鐵得出臺了新的隱私政策，想借此給自己套上免死金牌。

近日，谷歌更新隱私政策，表示將利用網(wǎng)絡(luò)公開數(shù)據(jù)訓(xùn)練旗下的AI模型。

數(shù)億網(wǎng)民數(shù)據(jù)將被用來訓(xùn)練AI？谷歌新隱私政策引發(fā)爭議！

其中，谷歌在新隱私協(xié)議的“可公開獲取的資源”中聲明：“我們可能會收集公開的在線信息或來自其他公共來源的信息，幫助訓(xùn)練Google的AI模型�！痹摯竽Ｐ蛯䴙楣雀璺g、谷歌旗下聊天機(jī)器人產(chǎn)品“Bard”及Cloud AI等產(chǎn)品和功能提供支持。

去年年底谷歌就更新了一版隱私政策。對比上一版，谷歌將“收集信息以幫助訓(xùn)練語言模型”的相關(guān)措辭更改為“訓(xùn)練人工智能模型”，并新增明確了自家AI產(chǎn)品對于數(shù)據(jù)的使用權(quán)利。

這似乎意味著，谷歌在訓(xùn)練旗下聊天機(jī)器人及其他AI模型，或未來開發(fā)AI產(chǎn)品的過程中，有權(quán)使用人們在網(wǎng)上公開發(fā)布的任意內(nèi)容，什么“版權(quán)”、隱私在該政策面前統(tǒng)統(tǒng)不存在了。

經(jīng)確認(rèn)，7月5日，谷歌中文版隱私政策也已經(jīng)進(jìn)行同步更新。

谷歌的這項政策沒有針對誰，指的是在座的所有網(wǎng)民。只要你在網(wǎng)上發(fā)表了什么內(nèi)容，谷歌都可以拿來訓(xùn)練AI。消息一出，網(wǎng)上瞬間炸開了鍋。

“版權(quán)已死” “隱私不在”等等悲觀情緒不一而足，更有的直言“AI正在吞食一切”。

數(shù)億網(wǎng)民數(shù)據(jù)將被用來訓(xùn)練AI？谷歌新隱私政策引發(fā)爭議！

但也有人認(rèn)為，谷歌的此項舉措并沒有嚴(yán)格意義上的“違規(guī)違法”。有相關(guān)律師表示，“無論在我國還是域外，對公開數(shù)據(jù)的正常收集和使用，在一般情況下不算違法�！钡撬€說，一旦個人通過郵件等方式明確拒絕了此項政策，那就另當(dāng)別論了。

其他法律人士表示，就目前可獲得的信息而言，谷歌對收集與處理用戶個人信息的范圍和目的作出了詳細(xì)說明，即使以歐盟GDPR項下更為嚴(yán)格的“告知－同意”規(guī)則為標(biāo)準(zhǔn)，谷歌的這一收集與處理行為至少在形式上具有合法性。

只是在實際施行中涉及的行為是否合法，還需進(jìn)一步確認(rèn)。

AI巨頭們的“數(shù)據(jù)之戰(zhàn)”

單純看谷歌的一系列操作，可能覺得有些無厘頭。但有意思的是，就在谷歌更新隱私政策前不久，另外一個AI巨頭就被起訴“侵犯隱私”。

兩名美國作家在舊金山聯(lián)邦法院對OpenAI提起訴訟，聲稱 OpenAI 沒有獲得版權(quán)授權(quán)，就濫用他們的作品來訓(xùn)練人工智能。

起訴書中顯示，OpenAI 的訓(xùn)練數(shù)據(jù)超過 30 萬本書，其中就包括本就飽受爭議，版權(quán)歸屬不清晰的“影子圖書館”（大多是以侵犯版權(quán)的方式向公眾免費提供書籍文獻(xiàn)內(nèi)容的線上網(wǎng)站）。

此前OpenAI和微軟還被16 位匿名人士要起訴，因為這兩家公司沒有經(jīng)過他們的同意就泄露了他們的個人隱私，要求兩家賠償30億美元。

數(shù)億網(wǎng)民數(shù)據(jù)將被用來訓(xùn)練AI？谷歌新隱私政策引發(fā)爭議！

這么看來，谷歌此舉反倒有一種“自保”的意圖。

而另一方面，則更加突出了AI大潮之下，數(shù)據(jù)的重要性。各家都在保衛(wèi)和爭奪“數(shù)據(jù)”中絞盡腦汁。

Reddit采取的方式簡單粗暴，就是提高API價格。Twitter則是限制數(shù)據(jù)的曝光，CEO馬斯克近日宣布 Twitter 將“臨時限制”用戶每日閱讀推文數(shù)量：未驗證的賬戶每天只能看到 600 條推文，對于新的未驗證賬戶，一天只能看到 300 條。經(jīng)過驗證的賬戶每天只能閱讀 6000 條帖子。