訂閱
糾錯(cuò)
加入自媒體

雷軍國(guó)慶將網(wǎng)友“罵”了整整七天!AI語(yǔ)音方向錯(cuò)了?

2024-10-09 10:41
雷科技
關(guān)注

只需3秒,你的聲音就能被完美克隆。

誰(shuí)能想到科技圈頂流之一的雷軍,居然因?yàn)锳I語(yǔ)音引起互聯(lián)網(wǎng)熱議?

國(guó)慶期間,小雷的抖音首頁(yè)幾乎被雷軍的AI語(yǔ)音包刷屏。視頻中的“雷軍”用熟悉的口音帶著些許不耐煩的語(yǔ)氣,戲謔地吐槽:“這游戲做成這樣,絕對(duì)是來?yè)v亂的!”由于這些用詞與雷軍本人十分相似,評(píng)論區(qū)也常有人問到:“這真是雷軍本人說的嗎?”

 

image.png

(圖源:抖音)

因神似雷軍說話的語(yǔ)氣和口音,這些語(yǔ)音包已經(jīng)在短視頻平臺(tái)迅速走紅。但隨著這股雷軍AI語(yǔ)音熱潮席卷網(wǎng)絡(luò),除了給網(wǎng)友們帶來歡樂,也掀起了更深層次的討論。AI語(yǔ)音技術(shù)的快速發(fā)展正深刻地改變著我們的生活,而它的濫用則讓我們意識(shí)到,這項(xiàng)技術(shù)帶來的不只是便利,還有潛在的風(fēng)險(xiǎn):如果雷軍的聲音可以如此輕松地被復(fù)制和惡搞,那在生活中,其他人的聲音是否也會(huì)面臨相同的風(fēng)險(xiǎn)呢?

惡搞雷軍,AI語(yǔ)音方向錯(cuò)了?

實(shí)際上,在雷軍AI語(yǔ)音出圈之前,已經(jīng)有不少明星“中招”。去年末,美國(guó)某知名歌手AI語(yǔ)音視頻頻頻出圈,視頻中的她不僅能說這一口流利的中文,甚至還發(fā)表了一些政治傾向明顯的言論,引起巨大爭(zhēng)議。該名歌手的團(tuán)隊(duì)也在了解此事后迅速發(fā)文澄清,但已經(jīng)有不少網(wǎng)友信以為真,造成了影響。

作為當(dāng)代最快實(shí)現(xiàn)普適化的AI技術(shù)之一,AI語(yǔ)音其實(shí)在我們生活中已經(jīng)相當(dāng)流行,例如抖音早早就推出了AI配音功能,讓創(chuàng)作者可以輸入一段文字后使用AI進(jìn)行語(yǔ)音生成,還能模仿不同的口音,不同的人物角色語(yǔ)氣等。

image.png

(圖源:剪映)

AI語(yǔ)音主要分為5種模式,分別是語(yǔ)音合成、語(yǔ)音克隆、語(yǔ)音識(shí)別、深度偽造和自然語(yǔ)言處理。大多數(shù)創(chuàng)作者在偽造名人AI語(yǔ)音時(shí),都會(huì)使用多種模式進(jìn)行炮制,比如雷軍的AI語(yǔ)音包,顯然使用了語(yǔ)音合成、語(yǔ)音克隆、深度偽造音頻以及自然語(yǔ)言處理的結(jié)合。這些技術(shù)共同作用,使得AI生成的語(yǔ)音能夠高度逼真地模仿雷軍的聲音和語(yǔ)氣,為用戶提供了一種“真假難辨”的體驗(yàn)。

當(dāng)然,假如AI語(yǔ)音合成僅僅停留在惡搞的層面上,或許還不至于讓網(wǎng)友們開始擔(dān)憂這項(xiàng)技術(shù)的安全性。根據(jù)美國(guó)聯(lián)邦貿(mào)易委員會(huì)(FTC)的數(shù)據(jù),2022年因親友冒充詐騙導(dǎo)致的損失高達(dá)2.6億美元,其中很多案件使用了AI語(yǔ)音克隆技術(shù) 。詐騙者通常只需幾秒鐘的語(yǔ)音片段,就能輕松模仿受害者親友的聲音,發(fā)起“緊急求助”的詐騙。這類騙局在美國(guó)、英國(guó)和印度等地頻發(fā),且常以老人和年輕人作為目標(biāo),讓人防不勝防。

AI語(yǔ)音之所以能夠快速席卷全球,并被不法分子利用到行騙當(dāng)中,其實(shí)與其發(fā)展勢(shì)頭過猛也脫不開關(guān)系。比如專注于AI語(yǔ)音技術(shù)研究的ElevenLabs,在前兩年就開發(fā)出了通過卷積神經(jīng)網(wǎng)絡(luò)(CNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN),平臺(tái)能夠識(shí)別和模仿獨(dú)特的發(fā)音模式,并復(fù)現(xiàn)這些特征,適用于個(gè)性化內(nèi)容制作,例如創(chuàng)建定制的虛擬助手聲音的技術(shù)。

image.png

(圖源:剪映)

更重要的是,ElevenLabs率先在提供了高保真的聲音克隆特性,這使得大多數(shù)創(chuàng)造者都能通過它獲得非常逼真的AI語(yǔ)音音頻。

不過,縱使AI語(yǔ)音引起了大眾對(duì)安全性的擔(dān)憂,但它的到來還是為人類進(jìn)入到AGI(通用人工智能技術(shù))時(shí)代提供了最基礎(chǔ)的技術(shù)支持,例如自然語(yǔ)言交流對(duì)話,這幾乎出現(xiàn)在所有主流AI工具上,OpenAI、Google、蘋果,都將這項(xiàng)技術(shù)視為最重要的交互模式。

AI語(yǔ)音被濫用,如何防詐成關(guān)鍵

多數(shù)普通用戶最常接觸到的AI語(yǔ)音造假,基本上都是惡搞名人語(yǔ)音包進(jìn)行視頻重新配音輸出的內(nèi)容,比如雷軍。這些惡搞視頻不乏粗鄙語(yǔ)言和不當(dāng)言論,不僅損害了名人的個(gè)人形象,還加劇了網(wǎng)絡(luò)暴力的蔓延 。這些內(nèi)容在社交媒體上廣泛傳播,誤導(dǎo)了公眾輿論,甚至讓人難以分辨真?zhèn),降低了人們?duì)社交媒體平臺(tái)的信任。

而雷軍也在個(gè)人社交賬號(hào)上用三個(gè)emoji表情回應(yīng)了近期AI語(yǔ)音出圈的事情,但并沒有表明要采取任何法律手段。當(dāng)然,這是因?yàn)槔总姷腁I語(yǔ)音多數(shù)都出現(xiàn)在抖音這樣的短視頻平臺(tái)上,而抖音很早就使用了AI技術(shù)的檢測(cè)工具,能夠在視頻內(nèi)容里標(biāo)注相關(guān)風(fēng)險(xiǎn),很大程度上避免了可能存在的糾紛和誤會(huì)。

image.png

(圖源:微博)

但不法分子往往會(huì)將AI語(yǔ)音克隆技術(shù)應(yīng)用到金融詐騙上,這種讓人無法分辨真假的語(yǔ)音包,的確存在較大的風(fēng)險(xiǎn)。

然而,面對(duì)AI語(yǔ)音濫用帶來的風(fēng)險(xiǎn),各界已經(jīng)開始采取措施以加強(qiáng)防范。銀行和金融機(jī)構(gòu)首先意識(shí)到了多重身份驗(yàn)證的重要性。例如,英國(guó)的一家在線銀行在強(qiáng)化生物識(shí)別和短信驗(yàn)證后,大幅減少了因語(yǔ)音詐騙而造成的損失。除了多因素驗(yàn)證,銀行還可以通過AI技術(shù)監(jiān)控潛在的語(yǔ)音欺詐行為,從而有效地保護(hù)用戶資金安全。

AI技術(shù)提供商同樣意識(shí)到自身的責(zé)任。ElevenLabs等公司在發(fā)現(xiàn)其技術(shù)被濫用后,迅速推出了檢測(cè)工具,并嚴(yán)格限制了未付費(fèi)用戶的訪問權(quán)限。這不僅可以幫助用戶識(shí)別虛假音頻,還能減少惡意濫用的機(jī)會(huì)。AI公司應(yīng)當(dāng)進(jìn)一步發(fā)展檢測(cè)技術(shù),與政府和行業(yè)組織合作,確保AI語(yǔ)音技術(shù)在合法、合理的范圍內(nèi)使用。

image.png

(圖源:ElevenLabs)

除了監(jiān)管機(jī)構(gòu)和AI技術(shù)提供商的防詐措施之外,我們普通用戶也需要警惕AI語(yǔ)音詐騙。

首先,許多安全專家建議在家人之間設(shè)置一個(gè)僅彼此知曉的“安全詞”。這種詞匯不僅僅是防止假冒親友的有效手段,更是為了在緊急情況中迅速確認(rèn)身份。McAfee的研究表明,AI只需三秒鐘的音頻樣本即可生成相似度達(dá)85%的語(yǔ)音克隆,增加這種簡(jiǎn)單的身份驗(yàn)證步驟,可以為我們提供額外的安全保障 。

在保護(hù)個(gè)人隱私方面,我們需要時(shí)刻謹(jǐn)慎對(duì)待自己在社交媒體上分享的內(nèi)容。AI詐騙者通常利用公開的音頻和視頻資料來生成虛假聲音,社交媒體上的信息可能會(huì)成為他們的“素材庫(kù)”。因此,盡量控制隱私設(shè)置,不要隨意上傳自己的語(yǔ)音或視頻內(nèi)容。保持低調(diào)的網(wǎng)絡(luò)存在感,能夠降低被不法分子盯上的可能性。

image.png

(圖源:ElevenLabs)

比如,在短視頻平臺(tái)分享生活時(shí),盡可能不使用自己的原聲,或者是使用AI工具對(duì)自己的聲音進(jìn)行處理后再發(fā)布。

而在金融防詐部分,我們也可以選擇啟用多因素身份驗(yàn)證,這是一種增加安全性的身份驗(yàn)證方法,要求用戶提供兩個(gè)或更多的驗(yàn)證信息。例如,在金融交易中,除了語(yǔ)音驗(yàn)證外,銀行可能還會(huì)要求用戶輸入一次性密碼(OTP)或使用生物識(shí)別技術(shù),如指紋識(shí)別,以進(jìn)一步驗(yàn)證身份。這種方法可以有效防止AI語(yǔ)音克隆帶來的風(fēng)險(xiǎn)。

最后,也是最重要的,我們需要提高識(shí)別AI語(yǔ)音的敏銳度。盡管AI技術(shù)能夠模擬聲音的情緒和語(yǔ)調(diào),但有時(shí)會(huì)存在細(xì)微的失真或不連貫。比如,目前雷軍的AI語(yǔ)音在短視頻平臺(tái)十分火爆,但仔細(xì)聆聽這些用AI工具克隆的語(yǔ)音,我們還是能發(fā)現(xiàn)詞語(yǔ)與詞語(yǔ)之間的不連貫性,這也有助于我們分辨這些聲音是否來自本人。

寫在最后

AI語(yǔ)音技術(shù)的迅猛發(fā)展不僅帶來了諸多便利,同時(shí)也暴露出一系列新的社會(huì)風(fēng)險(xiǎn)。雷軍AI語(yǔ)音包的爆火提醒我們,這項(xiàng)技術(shù)在為娛樂和搞笑視頻提供素材的同時(shí),也可能成為詐騙者手中的利器。AI語(yǔ)音濫用現(xiàn)象迫使我們反思科技發(fā)展的雙刃劍效應(yīng)。

未來,防范AI語(yǔ)音詐騙不僅是個(gè)人和企業(yè)的責(zé)任,更需要技術(shù)提供商和社會(huì)各界攜手合作,建立一個(gè)更加安全和可信的科技環(huán)境。技術(shù)的進(jìn)步應(yīng)當(dāng)服務(wù)于社會(huì),而非成為破壞社會(huì)信任的工具。唯有在監(jiān)管、技術(shù)創(chuàng)新與公共意識(shí)三者之間找到平衡,才能真正實(shí)現(xiàn)科技的價(jià)值。

來源:雷科技

       原文標(biāo)題 : 雷軍國(guó)慶將網(wǎng)友“罵”了整整七天!AI語(yǔ)音方向錯(cuò)了?

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)