我想使用 pyspeech API 转录 mp3(语音转文本)。不过,我不知道这是否可能。
是吗?如何?
我想使用 pyspeech API 转录 mp3(语音转文本)。不过,我不知道这是否可能。
是吗?如何?
pyspeech 似乎只是常规 Windows 语音 API 的 python 接口。您很可能会创建一些方法,将 mp3 播放视为该语音 API 收听的音频源。
我不了解 pyspeech,但如果它是围绕 Microsoft 语音 API 的 Python 包装器,那么其他一些帖子可能会有所帮助。
Microsoft 语音引擎不需要麦克风输入。他们可以接受音频文件。
如果您要进行转录,则需要听写语法。听写语法包含在随 Windows 7 和 Vista 一起提供的 Microsoft 语音引擎的客户端版本中。Microsoft 提供的服务器引擎上不提供听写语法。
在 C# 中使用带有 System.Speech 命名空间的听写语法的一个简单示例是 StackOverflow 问题SAPI 和 Windows 7 问题