我需要以编程方式分析读取已知脚本的录制声音。输出应该告诉我读到的单词的位置(在时间坐标中)(至少其中一些)。
我发现使用这种技术的“语音验证”服务有市场(自动验证录制的语音是否正确清晰地阅读特定文本)但我还没有找到任何我可以获得所需的软件或 lib/SDK从输出。
有人可以告诉我这种技术有多好以及我在哪里可以找到它吗?我对高级服务、完整的应用程序、库、SDK 感兴趣——不管它如何工作。预算:未知。
编辑:或多或少需要对大型欧洲语言的支持。英语、法语、德语、西班牙语、希腊语、意大利语、俄语、波兰语会很好,但也欢迎更多。这可能很难实现......