我已经尝试过,如 StackOverflow 上的建议,Openears 成功,并从 NSSTRINGS 数组生成自定义词汇表。但是,我们还需要从通讯录中识别姓名,而这里的回退方法不可避免地经常会惨败……</p>
我可以自己编写一个解析器并动态地将文本(主要是法语和荷兰语发音的名称)转录为音素,但这将是很多(猜测)工作……。我很确定我需要的数据是在识别过程中的某个地方生成的,所以也许有人可以以我可以在 iOS 上利用的方式将我指向 OpenEars 或 Flite 代码中的一个钩子?
或者其他一些可以将用户语音转换为我可以输入 Openears 的音素字符串的库?