當前位置:股票大全官網 - 工商資訊咨詢 - 招註音翻譯違法嗎?

招註音翻譯違法嗎?

這不違法。語音翻譯是翻譯工作。它是指將壹種語言的單詞和句子段落翻譯成另壹種語言,並將翻譯的內容以語音信息的形式傳遞給用戶。

首先要聽寫原聲,然後翻譯文字,最後合成聲音和字幕。可以試試Translai翻譯平臺,註冊賬號,上傳要翻譯的音視頻就行了。ai會自動聽寫輸入軸,方便多了。

我們知道聲音實際上是壹種波。mp3等常見的格式都是壓縮格式,必須轉換成未壓縮的純波形文件,比如Windows PCM文件,也叫wav文件。除了文件頭,wav文件中存儲的是聲音波形的點。

語音識別之前,有時需要切斷開頭和結尾的靜音,以減少對後續步驟造成的幹擾。這種靜音切割操作通常稱為VAD,它需要壹些信號處理技術。

要分析聲音,就要把聲音分幀,也就是把聲音切成小塊,每個小塊叫做壹幀。壹般取景操作不是簡單的剪切,而是利用移動窗口功能來實現,這裏不贅述。幀之間通常有重疊。

分幀後,講話變成許多小段。但波形在時域上幾乎沒有描述能力,必須進行變換。常見的變換方法是提取MFCC特征,根據人耳的生理特點,把每壹幀波形變成壹個多維向量,可以簡單理解為包含了這壹幀語音的內容信息。這個過程被稱為聲學特征提取。在實際應用中,這壹步有很多細節,聲學特性也不限於MFCC,這裏就不多說了。

此時,聲音就變成了壹個12行(假設聲學特征是12維)n列的矩陣,稱為觀測序列,其中n為總幀數。觀察順序如下圖所示。圖中每壹幀用12維的向量表示,色塊的色深表示向量值的大小。