訂閱
糾錯
加入自媒體

用AI回憶起曾被忘卻的語言

2023-03-28 16:46
腦極體
關(guān)注

語言是文明的DNA,然而聯(lián)合國教科文組織調(diào)查數(shù)據(jù)顯示,全球有七千多種有記錄的語言,超過400種瀕危,兩千種極危。中國語言種類繁多,目前有130 多種語言,有25種語言使用人口已不足千人。

以前的少數(shù)民族語言保護是采用田野調(diào)查建立起龐大的口語語料庫,保存了原始聲音文件和國際音標標注等豐富素材,但工作人員往往只能獲得單語語料,無法有效解讀語義,而且中國國土面積廣闊,田野調(diào)查的時間和經(jīng)費成本非常高,少數(shù)民族語言的保護傳承工作道阻且長。

隨著AI技術(shù)在千行百業(yè)中的深入發(fā)展,大家發(fā)現(xiàn)AI技術(shù)在保護少數(shù)民族語言方面有獨特的優(yōu)勢,研發(fā)出的無監(jiān)督跨語言詞向量算法+OCR光學(xué)智能識別技術(shù)合成的自動生成式“漢語-少數(shù)民族語言”辭典成為保護少數(shù)民族語言的曙光。下面就讓白洞帶大家了解AI究竟是如何保護少數(shù)民族語言的吧!

       原文標題 : 用AI回憶起曾被忘卻的語言

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號