1

我知道 sphinx 3(现在称为 Pocketsphinx)支持非英语语音识别,如德语、西班牙语和中文。但是 sphinx 4 也支持这些语言吗?

要进行语音识别,需要三个文件:声学模型文件、语言模型文件和字典文件。但是 sphinx 4 只能读取 ASCII 编码的文件,而一些非英语语言的字典和语言模型是 UTF-8 编码的。

似乎 CMU sphinx 4 默认只能支持 ASCII 编码语言。这是真的吗?

任何帮助将不胜感激!!!

4

1 回答 1

1

似乎 CMU sphinx 4 默认只能支持 ASCII 编码语言。这是真的吗?

sphinx4 支持 utf-8 编码文件。要确保 java 使用 utf-8 进行输入输出,您可以向 java 命令行(或 IDE 中的 JVM)添加一个选项:

   -Dfile.encoding=utf-8
于 2013-11-13T14:40:41.617 回答