4

执行此操作的最佳库是什么。并且是质量好足以依靠。不可能用说话者的声音训练系统或使用术语词典来改善结果。

4

1 回答 1

3

在 Windows 上,您想使用 SAPI 接口(语音 API)。有多种实现。Microsoft 在 Windows 中包含一个免费的。Dragon NaturallySpeaking 是一种非免费的,我过去曾看到它用于类似的任务(努力)。如果演讲者说话清晰(而不是相互重叠和打断),那么缺乏培训就不会那么严重。

但是,您不会得到好的成绩单,准确性会很差,以至于您获得的内容仅对索引有用。大词和独特的短语会很好地弹出,特别是如果您创建自定义词典(我知道您说过您不想这样做)。例如,查找所有提及“Pelosi”和“public option”的新闻片段。

于 2009-11-19T17:05:05.553 回答