訂閱
糾錯(cuò)
加入自媒體

AI行業(yè)研報(bào):生成式文字后即將爆發(fā)生成式音頻?

作 者 | BT財(cái)經(jīng)

來 源 | 德意志銀行了解更多金融信息 | BT財(cái)經(jīng)數(shù)據(jù)通

在爆發(fā)全球熱潮前,人工智能是經(jīng)過了多年醞釀的。為了正確預(yù)測(cè)未來的人工智能創(chuàng)新,我們回到源頭,研究了人工智能應(yīng)用的專利和風(fēng)險(xiǎn)投資交易活動(dòng)。

我們收集了193個(gè)世界知識(shí)產(chǎn)權(quán)組織(WIPO)成員在2012年至2022年期間公布的175072項(xiàng)人工智能專利,分為五大類。對(duì)于風(fēng)險(xiǎn)資本投資,我們使用了經(jīng)合組織(OECD)人工智能數(shù)據(jù)庫2012年至2022年92個(gè)經(jīng)濟(jì)體的24310筆交易數(shù)據(jù)。

按絕對(duì)值計(jì)算,自2012年以來,人工智能領(lǐng)域的風(fēng)險(xiǎn)投資活動(dòng)和專利數(shù)量激增。期間,風(fēng)險(xiǎn)投資交易數(shù)量增加了10倍,達(dá)到3884筆,2022年的交易價(jià)值幾乎是2012年的50倍,達(dá)到830億美元。與此同時(shí),人工智能專利數(shù)量在2022年增長(zhǎng)了7倍,達(dá)到近3.7萬個(gè)。

從風(fēng)險(xiǎn)投資交易和專利來看,過去10年,超過三分之二的人工智能創(chuàng)新集中在交通、工業(yè)和消費(fèi)等行業(yè)應(yīng)用上。

接下來,我們預(yù)計(jì)生成式音頻(generative audio)將在2024年大規(guī)模出現(xiàn),并顛覆游戲和電影制作等行業(yè)。

1

人工智能走出冬眠

隨著OpenAI的ChatGPT于2022年11月發(fā)布,人們對(duì)人工智能的興趣激增,不僅是普通人,企業(yè)也是如此。2022年,公司文件中提到“人工智能”的次數(shù)超過71.5萬次,而2020年僅為13.5萬次。根據(jù)我們的調(diào)查,到2023年4月,41%的美國(guó)人已經(jīng)聽說過ChatGPT,而近60%的人表示他們的工作已經(jīng)在某種程度上開始使用ChatGPT。

 

此外,在5月18日的新聞中,ChatGPT在美國(guó)發(fā)布了第一個(gè)應(yīng)用程序版本后,現(xiàn)在可以在iPhone上使用。谷歌還于5月5日宣布,將開始推出集成到搜索產(chǎn)品中的生成式人工智能工具。在進(jìn)一步研究之前,我們先對(duì)人工智能進(jìn)行簡(jiǎn)單的定義——人工智能是一種基于機(jī)器的系統(tǒng),人類給出一組給定的目標(biāo),它可以作出預(yù)測(cè)、建議甚至決定,從而可能影響現(xiàn)實(shí)或虛擬環(huán)境。

人工智能其實(shí)已經(jīng)醞釀了好幾年。自2012年以來,與人工智能相關(guān)的風(fēng)險(xiǎn)投資交易活動(dòng)和已公布的專利一直在悄然飆升。例如,風(fēng)投數(shù)量從2012年的332筆增長(zhǎng)到2022年的3884筆。2022年,風(fēng)投交易價(jià)值達(dá)到830億美元,高于2012年的18億美元。與此同時(shí),自2012年以來,人工智能方面的專利數(shù)量增加了7倍。

人工智能行業(yè)的進(jìn)入門檻一直在降低,這刺激了該領(lǐng)域的商業(yè)創(chuàng)新。例如,自2018年以來,圖像分類系統(tǒng)的訓(xùn)練成本降低了64%,而訓(xùn)練時(shí)間減少了94%。包括OpenAI、Anthropic、Stability AI、A121 Labs、Midjourney和Cohere在內(nèi)的眾多初創(chuàng)公司和風(fēng)投公司也紛紛涌現(xiàn)。據(jù)報(bào)道,Anthropic最近在C輪融資中籌集了4.5億美元,參與融資的有Alphabet、賽富時(shí)(Salesforce)和Zoom。此外,一家倫敦的人工智能公司Builder. Ai在最新一輪融資中籌集了2.5億美元。

為了正確預(yù)測(cè)人工智能即將到來的情況,我們還研究了該領(lǐng)域的專利。我們預(yù)計(jì),獲得風(fēng)投的公司大約需要兩到三年時(shí)間才能將產(chǎn)品推向市場(chǎng),甚至需要更長(zhǎng)的時(shí)間等待專利批準(zhǔn),如七至十年。就專利而言,在公司專利獲得保護(hù)后,他們則需要營(yíng)銷,選擇商業(yè)伙伴等,這大概需要一到三年時(shí)間。

通過世界知識(shí)產(chǎn)權(quán)組織Patentscope,我們收集了193個(gè)該組織成員在2012年至2022年期間公布的175072項(xiàng)人工智能專利條目,這些專利分為五大類,其中包括部門應(yīng)用(sectoral applications)、服務(wù)平臺(tái)(horizontal platforms)、自動(dòng)化機(jī)器(autonomous machines)和半導(dǎo)體(semiconductors)。在風(fēng)投方面,我們使用的是經(jīng)合組織人工智能數(shù)據(jù)庫涵蓋的92個(gè)經(jīng)濟(jì)體的24310筆交易。 

1. 人工智能景觀——將創(chuàng)意帶入生活 

股票市場(chǎng)反應(yīng)如何

迅速采用ChatGPT和其他新的人工智能的公司股價(jià)飆升。例如,2023年1月31日,人工智能軟件企業(yè)C3. ai推出了集OpenAI、谷歌、學(xué)術(shù)研究等人工智能技術(shù)于一體的“生成式人工智能產(chǎn)品套件”。當(dāng)日,該公司股價(jià)上漲近22%,自今年年初以來已累計(jì)上漲143%。

人工智能音頻和語音識(shí)別軟件公司SoundHound的股價(jià)今年迄今已上漲66%。

不僅僅是人工智能軟件公司,人工智能幾乎影響了價(jià)值鏈上的所有公司。英偉達(dá)是一家半導(dǎo)體公司,其生產(chǎn)的計(jì)算機(jī)芯片可以運(yùn)行人工智能模型,該公司股價(jià)上漲了110%。在大型科技公司之間的人工智能競(jìng)賽中,Meta也表現(xiàn)出色。 

資金流向人工智能

2022年,全球?qū)θ斯ぶ悄艿娘L(fēng)險(xiǎn)投資達(dá)到830億美元的峰值,高于2012年的18億美元。Databricks和麻省理工學(xué)院發(fā)現(xiàn),大多數(shù)公司已經(jīng)開始廣泛部署人工智能。在樣本中,到2022年未使用人工智能的公司比例不到6%。 

企業(yè)將從人工智能增長(zhǎng)中受益

多年來,人工智能研究一直局限于學(xué)術(shù)界,如今正被應(yīng)用于商業(yè)領(lǐng)域。學(xué)術(shù)界是先行者,從學(xué)術(shù)發(fā)表到獲得專利通常需要15年的時(shí)間。

然而,越來越明顯的是,人工智能創(chuàng)新爆發(fā)的時(shí)機(jī)已經(jīng)成熟。從2012年到2022年,49%的風(fēng)投交易是在過去三年達(dá)成的。同樣,我們的數(shù)據(jù)庫中有52%的人工智能相關(guān)專利在三年內(nèi)發(fā)布。 

2. 應(yīng)用領(lǐng)域:人工智能將在2023年成為主流 

亞馬遜創(chuàng)始人兼執(zhí)行主席Jeff Bezos表示:“我們現(xiàn)在正在用機(jī)器學(xué)習(xí)和人工智能來解決問題,現(xiàn)在發(fā)生的這一切猶如科幻小說里描述的內(nèi)容。”

過去10年,與人工智能相關(guān)的風(fēng)投交易中,近五分之四是在行業(yè)應(yīng)用領(lǐng)域。另有8%發(fā)生在自動(dòng)化機(jī)器和汽車領(lǐng)域,還有13%發(fā)生在半導(dǎo)體領(lǐng)域。人工智能相關(guān)專利的比例也類似。 

行業(yè)應(yīng)用:人工智能不局限于一個(gè)行業(yè)

目前,79%的風(fēng)投交易和61%的專利發(fā)生在我們認(rèn)為的“行業(yè)應(yīng)用”中。根據(jù)我們的定義,這包括消費(fèi)、工業(yè)、資訊科技、運(yùn)輸、醫(yī)療保健、金融服務(wù)業(yè)。

從2012年到2022年,風(fēng)投交易數(shù)量從270筆增加到3006筆,增長(zhǎng)了10倍多。2022年,交易總額達(dá)到620億美元,遠(yuǎn)高于2012年的13億美元。在這些領(lǐng)域發(fā)布的專利也在蓬勃發(fā)展。自2012年以來,相關(guān)專利數(shù)量增加了6倍。擁有最多專利的公司都是公認(rèn)的科技巨頭,如IBM、三星(Samsung)、英特爾(Intel)、LG電子(LG Electronics)和高通(Qualcomm)。

 

服務(wù)平臺(tái):AI工具

自2012年以來,我們看到服務(wù)平臺(tái)(horizontal platforms)的專利數(shù)量增長(zhǎng)了近6倍,包括人工智能主核(AI core)、自然語言技術(shù)(natural language technology)、人工智能自動(dòng)化平臺(tái)(AI automation platforms)、計(jì)算機(jī)視覺軟件(computer vision software)。服務(wù)型應(yīng)用(Horizontal applications)是人工智能開發(fā)和部署的重點(diǎn)模塊,擁有這類專利的公司包括AT&T、IBM、LG電子、百度以及老牌科技企業(yè)。

 

自然語言處理(Natural language processing)是一種用于大型語言模型(LLMs)的人工智能工具,隨著ChatGPT的出現(xiàn)而變得流行。自然語言處理的一些例子包括翻譯、自動(dòng)糾錯(cuò)、自動(dòng)文本摘要、聊天機(jī)器人,以及金融領(lǐng)域的信息需求等處理方式。

計(jì)算機(jī)視覺涉及使用人工智能來分析視覺數(shù)據(jù),并做出有意義的預(yù)測(cè),包括面部識(shí)別、地理空間分析等。

微軟的Inner Eye技術(shù)已經(jīng)可以幫助檢測(cè)腫瘤和異常細(xì)胞。在他們的最新研究中,微軟展示了其技術(shù)如何幫助臨床醫(yī)生。在計(jì)算機(jī)視覺專利數(shù)量最多的五家公司中,有兩家是中國(guó)公司,分別是百度和華為。 

誰還需要駕照?自動(dòng)駕駛已經(jīng)到來

在過去十年中,8%的風(fēng)投交易和16%的專利都發(fā)生在“自動(dòng)化機(jī)器”領(lǐng)域。這類技術(shù)涵蓋兩個(gè)關(guān)鍵領(lǐng)域,分別是自動(dòng)駕駛汽車和智能機(jī)器人。在過去的十年里,這個(gè)領(lǐng)域受到了很多關(guān)注。這在很大程度上與特斯拉取得的成功相吻合,特斯拉一直在試驗(yàn)自動(dòng)駕駛汽車系統(tǒng)。

從2012年到2022年,自動(dòng)化機(jī)器領(lǐng)域的風(fēng)投交易數(shù)量從22筆增加到363筆。智能機(jī)器人就屬于這一類。這些機(jī)器人能夠在不需要人類干預(yù)和輸入的情況下進(jìn)行一定程度的操作。人工智能通常用于協(xié)助機(jī)器人機(jī)型訓(xùn)練和適應(yīng)。三星、LG電子、英特爾以及中國(guó)的大疆公司和滴滴等公司在機(jī)器人專利方面地位穩(wěn)固。

幾年來,自動(dòng)駕駛汽車也一直是人們討論的焦點(diǎn)。除了特斯拉之外,其他公司也在擴(kuò)大對(duì)自動(dòng)駕駛汽車所需技術(shù)的研究和投資,因此,風(fēng)險(xiǎn)投資和專利申請(qǐng)的大幅增加很可能是在這個(gè)背景下發(fā)生的。 

半導(dǎo)體芯片

英偉達(dá)首席執(zhí)行官黃仁勛表示:“很明顯,人工智能將影響每一個(gè)行業(yè)。我認(rèn)為每個(gè)國(guó)家都需要確保人工智能是其國(guó)家戰(zhàn)略的一部分,每個(gè)國(guó)家都會(huì)受到影響。”

半導(dǎo)體占人工智能相關(guān)風(fēng)投交易的13%,占已公布專利的4%,包括處理器設(shè)計(jì)(processor design)、邊緣人工智能軟件(edge AI software)、智能傳感器和設(shè)備(intelligent sensors & devices)。

從2012年到2022年,半導(dǎo)體領(lǐng)域的風(fēng)投交易從40筆增加到515筆。2022年,該領(lǐng)域交易總額達(dá)到94億美元,高于2012年的2億美元。同樣,從2012年到2022年,該領(lǐng)域?qū)@麛?shù)量增長(zhǎng)了7倍。

自20世紀(jì)70年代以來,芯片經(jīng)歷了快速的創(chuàng)新,芯片性能每隔幾年就會(huì)翻一番。生產(chǎn)商必須跟上發(fā)展的步伐,否則就有被甩在后面的風(fēng)險(xiǎn)。隨著技術(shù)變得越來越復(fù)雜,新工具是必要的,這正是人工智能可以發(fā)揮作用的地方。 

3. 2024年及以后的新機(jī)遇

生成式音頻可能是下一個(gè)大熱門 

人工智能現(xiàn)在能夠根據(jù)不同語言、口音和方言的文本輸入創(chuàng)造人類的聲音和合成音頻。它使用了在ChatGPT中流行的生成式人工智能。

從2020年第一季度到2022年第四季度,提到“生成式音頻(generative audio)”的公司文件數(shù)量增加了13倍以上。

隨著音樂和聲音研發(fā)的深入,我們可能會(huì)看到新競(jìng)爭(zhēng)者的爆炸式增長(zhǎng)。很快,人們可以輸入文本或圖像來生成音頻內(nèi)容,而不需要音頻專家或計(jì)算機(jī)專家。

這可能會(huì)影響游戲、通信、音樂、新聞和醫(yī)療保健等一系列領(lǐng)域。擁有生成式音頻相關(guān)專利最多的公司包括索尼(Sony)、亞馬遜、華為、字節(jié)跳動(dòng)、Adobe、蘋果和騰訊。 

可以生成什么音頻?

生成式音頻分為四個(gè)主要類別,包括合成聲音(synthetic voice)、語音互動(dòng)(speech interaction)、音樂生成(music generation)和音頻編輯(audio editing)。首先,通過深度學(xué)習(xí),人工智能可以高質(zhì)量地合成真實(shí)的人聲,包括音高、音調(diào)和節(jié)奏。語音互動(dòng)包括虛擬助手等技術(shù),例如蘋果的Siri和亞馬遜的Alexa。隨著技術(shù)的發(fā)展,人類與人工智能之間的“自然”互動(dòng)可能會(huì)越來越多。

音樂生成技術(shù)可以輕松地創(chuàng)造出種類繁多的新音樂。例如Spotify的DJ和Aimi Studio。人工智能音樂已經(jīng)對(duì)音樂產(chǎn)業(yè)構(gòu)成了挑戰(zhàn)。

最后,音頻編輯可以使用人工智能來提高音頻錄制質(zhì)量。 

2

結(jié)論

人工智能來了,新的創(chuàng)新就在眼前。以專利和風(fēng)險(xiǎn)投資等指標(biāo)進(jìn)行衡量,人工智能領(lǐng)域的創(chuàng)新在過去10年呈爆炸式增長(zhǎng)。從風(fēng)險(xiǎn)投資活動(dòng)和專利來看,過去十年中,超過三分之二的人工智能創(chuàng)新集中在交通、工業(yè)和消費(fèi)者應(yīng)用等領(lǐng)域,其次是自動(dòng)化機(jī)器和服務(wù)型應(yīng)用、半導(dǎo)體產(chǎn)業(yè)。

在2023年之后,我們預(yù)計(jì)生成音頻創(chuàng)新將會(huì)激增。隨著ChatGPT和DALL-E的到來,我們已經(jīng)看到生成式人工智能引起了世界的關(guān)注。這些技術(shù)將共同改變游戲和電影制作等行業(yè)。

文章系作者個(gè)人觀點(diǎn)如有疑問及任何意見反饋可直接在評(píng)論區(qū)留言或發(fā)送郵件

       原文標(biāo)題 : AI行業(yè)研報(bào):生成式文字后即將爆發(fā)生成式音頻?

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)