audio - 使用袖珍狮身人面像解码 8 位波形文件

Question

我正在尝试将我的电话应用程序与袖珍狮身人面像语音识别器集成。我得到的记录文件类型是以下类型：

Input File     : '5555_9911848379__15-10-14-17-36_.wav'
Channels       : 1
Sample Rate    : 11025
Precision      : 8-bit
Duration       : 00:00:03.99 = 44000 samples ~ 299.32 CDDA sectors
File Size      : 44.0k
Bit Rate       : 88.3k
Sample Encoding: 8-bit Unsigned Integer PCM

但是，此处给出的示例程序http://cmusphinx.sourceforge.net/wiki/tutorialpocketsphinx 期望以 16000 HZ 采样的 16 位 PCM 音频。

有什么办法可以解码上面提到的录制文件。还是我必须将上述格式转换为 16 位格式？

score 0 · Accepted Answer

有什么办法可以解码上面提到的录制文件。

不，您需要 16 位

还是我必须将上述格式转换为 16 位格式？

转换将无济于事，因为信息已经丢失。您需要 16 位录制。

您需要确保以正确的格式录制音频。

audio - 使用袖珍狮身人面像解码 8 位波形文件

1 回答 1

Related

Reference