我目前正在使用 Dragon 在 IVR 监控系统上执行电话转录。基本上我用dragon监视一个文件夹,将wav文件放在那里,然后等待另一个文件夹中的转录输出。由于龙崩溃,这种解决方案最近引起了相当大的麻烦。
我想要一个简单的可执行文件按需执行转录(从而消除永久运行的软件的需要),例如:
cmd -> 转录 in.wav > out.txt
该软件应该具有可用的意大利语词典和声学模型,或者至少应该易于训练以支持意大利语。我需要在没有办公套件的情况下在 windowx xp 嵌入式(一个相当旧的版本!)上运行,所以 Windows 语音引擎不是一个选项。
任何 lib/dll 以及它在 vbscript 或 python 中使用的代码片段也可以吗?