Meta已開發(fā)閩南語(yǔ)AI翻譯,解決非文字語(yǔ)言翻譯難題
近日,Meta宣布推出口語(yǔ)翻譯系統(tǒng),Meta CEO扎克伯格在facebook上發(fā)布demo影片,首次在線上通過(guò)該翻譯系統(tǒng)和員工對(duì)話。
在demo影片中,扎克伯克說(shuō)英文,來(lái)自臺(tái)灣的Meta工程師用閩南語(yǔ),通過(guò)該口語(yǔ)翻譯系統(tǒng),兩人無(wú)障礙交流,且翻譯都非常地道。
Meta稱,將閩南語(yǔ)翻譯成英語(yǔ)的這套系統(tǒng),是第一個(gè)由AI驅(qū)動(dòng)的“為非文字語(yǔ)言開發(fā)的語(yǔ)音翻譯系統(tǒng)”。
在全球范圍內(nèi),有許多語(yǔ)言和閩南語(yǔ)一樣,有人使用,但沒(méi)有標(biāo)準(zhǔn)化的書寫方式,而AI翻譯系統(tǒng)需依靠大量的可標(biāo)簽范例,像是口語(yǔ)標(biāo)簽或字符,才能把資料“喂”給機(jī)器學(xué)習(xí)。
Meta的研究團(tuán)隊(duì)稱:“我們利用普通話作為中間語(yǔ)言來(lái)建立偽標(biāo)簽,我們首先將英語(yǔ)(或閩南語(yǔ))語(yǔ)音翻譯成普通話文本,然后我們?cè)俜g成閩南語(yǔ)(或英語(yǔ)),并將其加入訓(xùn)練數(shù)據(jù)。”
目前,該系統(tǒng)允許講閩南語(yǔ)的人與講英語(yǔ)的人交談,盡管很生硬。該模型一次只能翻譯一個(gè)完整的句子,但扎克伯格相信,這項(xiàng)技術(shù)最終可以應(yīng)用于更多語(yǔ)言,并將改進(jìn)到提供實(shí)時(shí)翻譯的程度。
Meta宣布,他們將開放大型語(yǔ)料庫(kù),讓研究人員可以為更多“無(wú)法書寫的語(yǔ)音”建立翻譯系統(tǒng)。業(yè)內(nèi)人士認(rèn)為,良好的翻譯工具對(duì)于元宇宙的開發(fā)不可或缺。
【開源AI模型,精準(zhǔn)翻譯超200種語(yǔ)言】
今年7月,Meta公司宣布將免費(fèi)開源旗下AI系統(tǒng)NLLB-200 ,該系統(tǒng)是全球第一個(gè)能翻譯200種不同語(yǔ)言的單一AI模型,將為超過(guò)10億人提供高品質(zhì)翻譯內(nèi)容。
Meta公司稱,將會(huì)把NLLB-200對(duì)外開源,同時(shí)向非營(yíng)利機(jī)構(gòu)提供20萬(wàn)美元的資助,以開發(fā)該技術(shù)應(yīng)用于更多應(yīng)用程式上。
德國(guó)慕尼黑大學(xué)計(jì)算機(jī)語(yǔ)言學(xué)家Alexander Fraser認(rèn)為,該模型的主要貢獻(xiàn)在于數(shù)據(jù),包含了100種全新語(yǔ)言。
目前,市面上很多翻譯工具并不支持冷門的語(yǔ)言,也就是少于百萬(wàn)人口使用的語(yǔ)言,而NLLB-200解決了這個(gè)問(wèn)題。
【"不遺漏任何語(yǔ)言"】
全球有數(shù)十億人,但一直以來(lái)卻沒(méi)有可以翻譯上百種語(yǔ)言的高品質(zhì)翻譯工具,他們無(wú)法通過(guò)自己慣用的語(yǔ)言或母語(yǔ)瀏覽網(wǎng)絡(luò)上的內(nèi)容,或在網(wǎng)絡(luò)社群上參與討論,尤其是對(duì)于非洲、亞洲等地區(qū)有高達(dá)數(shù)億人使用不同種類的語(yǔ)言。
為了突破網(wǎng)絡(luò)上的語(yǔ)言障礙,并促進(jìn)元宇宙發(fā)展,Meta的AI研究人員早年已成立NLLB專案,開發(fā)AI模型為全世界提供高品質(zhì)的翻譯功能。
據(jù)悉,NLLB是“No Language Left Behind(不遺漏任何語(yǔ)言)”的縮寫,該AI系統(tǒng)可以高質(zhì)量翻譯世界上多達(dá)200種語(yǔ)言,除了主流語(yǔ)言外,其中還包含多達(dá)55種非洲系語(yǔ)言及其他少數(shù)語(yǔ)言。
在多項(xiàng)指標(biāo)中,相較現(xiàn)有的其他翻譯工具,NLLB-200的翻譯品質(zhì)平均高出44%。在部分非洲和印度語(yǔ)言中,提升幅度相較最新的翻譯系統(tǒng)更提升了70%。
此外,Meta也與維基基金會(huì)合作,希望NLLB-200之后可以提供維基百科翻譯的服務(wù),改善維基百科的翻譯系統(tǒng)。通過(guò)雙方的合作,NLLB-200持續(xù)學(xué)習(xí)其他翻譯器中無(wú)法翻譯的語(yǔ)言,AI模型可以自己學(xué)習(xí)語(yǔ)言中的文字系統(tǒng),得到更準(zhǔn)確的翻譯結(jié)果。
可以想象的是,“通用語(yǔ)音翻譯系統(tǒng)”一旦在元宇宙中實(shí)現(xiàn),可以讓全世界不同語(yǔ)種的用戶,在元宇宙虛擬空間里溝通、開會(huì)、玩游戲,將會(huì)比在現(xiàn)實(shí)中更加方便,也將更進(jìn)一步實(shí)現(xiàn)Meta對(duì)發(fā)展元宇宙的野心。
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
即日-10.29立即報(bào)名>> 2024德州儀器嵌入式技術(shù)創(chuàng)新發(fā)展研討會(huì)
-
10月31日立即下載>> 【限時(shí)免費(fèi)下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報(bào)名>>> 【在線會(huì)議】多物理場(chǎng)仿真助跑新能源汽車
-
11月14日立即報(bào)名>> 2024工程師系列—工業(yè)電子技術(shù)在線會(huì)議
-
12月19日立即報(bào)名>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
即日-12.26火熱報(bào)名中>> OFweek2024中國(guó)智造CIO在線峰會(huì)
推薦專題
- 1 Intel宣布40年來(lái)最重大轉(zhuǎn)型:年底前裁員15000人、拋掉2/3房產(chǎn)
- 2 因美封殺TikTok,字節(jié)股價(jià)骨折!估值僅Meta1/5
- 3 宏山激光重磅發(fā)布行業(yè)解決方案,助力智能制造產(chǎn)業(yè)新飛躍
- 4 國(guó)產(chǎn)AI芯片公司破產(chǎn)!白菜價(jià)拍賣
- 5 具身智能火了,但規(guī)模落地還需時(shí)間
- 6 國(guó)產(chǎn)英偉達(dá)們,抓緊沖刺A股
- 7 三次錯(cuò)失風(fēng)口!OpenAI前員工殺回AI編程賽道,老東家捧金相助
- 8 英特爾賦能智慧醫(yī)療,共創(chuàng)數(shù)字化未來(lái)
- 9 英偉達(dá)的麻煩在后頭?
- 10 將“網(wǎng)紅”變成“商品”,AI“爆改”實(shí)力拉滿
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市