訂閱
糾錯
加入自媒體

訊飛智能錄音筆SR502:離線轉(zhuǎn)寫+視頻字幕識別

2020-12-08 09:04
IT168
關(guān)注

說到智能錄音筆,那可是很多媒體人、商務(wù)人的必備生產(chǎn)力工具,其中訊飛的產(chǎn)品一直是業(yè)界頂流。而在前不久,訊飛智能錄音筆SR502正式線上發(fā)布。在SR501精確轉(zhuǎn)寫和智能編輯的基礎(chǔ)上,升級了離線轉(zhuǎn)寫、OCR文字提取、視頻字幕自動生成等多項核心功能。高達(dá)98%的轉(zhuǎn)寫準(zhǔn)確率和強降噪,也為大家的工作效率和效果提供保障。

金屬外框+前后玻璃質(zhì)感十足

訊飛智能錄音筆SR502將屏幕升級到3.5英寸,顯然是進(jìn)一步提升了實時查看轉(zhuǎn)寫內(nèi)容這個體驗。金屬機身上是玻璃背板,手感依然輕盈細(xì)膩,這也是作為一款好錄音筆的必備條件。

↑大屏觸控+Android系統(tǒng),操作很容易上手

↑盡管采用金屬材質(zhì),機身卻不會太重

↑左側(cè)繼續(xù)保留了錄音鍵,可以快速開始錄音

為了達(dá)到更好的降噪效果,SR502搭載了2顆直徑10mm定向麥克風(fēng)+6顆矩陣麥克風(fēng),結(jié)合訊飛Voice Cube AI降噪拾音技術(shù),最遠(yuǎn)錄音距離達(dá)到15米,且可實現(xiàn)10米遠(yuǎn)距離實時中英互譯。

↑在大型會議或新聞發(fā)布會中,定向麥克風(fēng)可以實現(xiàn)遠(yuǎn)距離拾音

↑專業(yè)的麥克風(fēng)矩陣,保證了拾音的清晰準(zhǔn)確

訊飛智能錄音筆SR502除了降噪出色,針對普通話外的方言和外語都有進(jìn)行優(yōu)化。在純中文、純英文模式識別之外,同時支持中英混合識別場景,以及普通話-部分方言混合識別。最多支持8種語言、12門方言、2種少數(shù)民族語言。

↑多語種的支持,訊飛智能錄音筆SR502也可以實現(xiàn)中英互譯

↑多語言/方言的支持,對視頻字幕生成也是適用的

訊飛智能錄音筆SR502還擁有一顆800萬像素攝像頭,在轉(zhuǎn)寫的同時可拍下照片,將照片中的文字提取出來(OCR),并對文字進(jìn)行編輯。同時也可錄制短視頻,視頻自動生成字幕。

離線轉(zhuǎn)寫+OCR識別提升效率

看過外觀設(shè)計后,接下來實際體驗一下。訊飛智能錄音筆SR502用上了新升級的轉(zhuǎn)寫ED引擎。這套引擎基于端到端的全新語音識別框架,配上4核處理器,轉(zhuǎn)寫準(zhǔn)確率達(dá)到了98%。

↑在線模式下,錄音實時轉(zhuǎn)文字的速度和準(zhǔn)確率堪稱優(yōu)秀

↑錄音保存時可以詳細(xì)分類,并支持語音查找文件

↑在線轉(zhuǎn)寫可以后臺進(jìn)行,不影響后續(xù)的錄音工作

↑在線模式下,還可以進(jìn)行即時中/英、英/中的錄音轉(zhuǎn)寫

訊飛智能錄音筆SR502更強大的突破在于,無網(wǎng)絡(luò)情況下可以進(jìn)行離線轉(zhuǎn)寫。無需4G/WIFI網(wǎng)絡(luò),離線轉(zhuǎn)寫準(zhǔn)確率也高達(dá)95%。有了這個功能,擺脫網(wǎng)絡(luò)依賴的訊飛智能錄音筆SR502,自然能面對更多復(fù)雜場景。如果需要精確轉(zhuǎn)寫,在網(wǎng)絡(luò)恢復(fù)后,也可以手動進(jìn)行錄音上傳。

↑網(wǎng)絡(luò)不好的狀態(tài)下,可以開啟離線模式

↑離線模式為實時轉(zhuǎn)寫,錄音完成即可保存在本地

訊飛智能錄音筆SR502還支持OCR文字識別功能。對于商務(wù)會議、媒體采訪派發(fā)的文字資料,可以在不影響錄音、轉(zhuǎn)寫的情況下,馬上轉(zhuǎn)換為文檔并且編輯。相信經(jīng)常記錄會議或編寫稿件的小伙伴,會相當(dāng)喜歡這個功能,因為效率提升可不是一點點。

短視頻制作是當(dāng)下的潮流,但字幕錄入還是傳統(tǒng)“手打”工藝。對此,訊飛智能錄音筆SR502加入了一個相當(dāng)實用的功能,可以拍攝單次最長5分鐘的短片并實時生成支持后續(xù)編輯的字幕。

↑感覺視頻工作者可以人手一臺,這樣做字幕省事不少

這才是生產(chǎn)力工具

在很多小伙伴的印象中,智能錄音筆就是語音轉(zhuǎn)文字的專業(yè)工具。但訊飛智能錄音筆SR502的登場,顯然要打破這些刻板印象。這里也要佩服訊飛的腦洞,基于強大的AI算法和攝像頭的加入,訊飛智能錄音筆SR502不但保持了高精度的轉(zhuǎn)寫。同時為用戶帶來離線轉(zhuǎn)寫,這種不依賴網(wǎng)絡(luò)的記錄模式。而多語種識別以及視頻字幕生成的實現(xiàn),更是為更多從業(yè)人員,從繁重的文字工作中解放出來,實現(xiàn)工作效率的再次提升。

作者:正骨水

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標(biāo)題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號