6

我想使用 pyspeech API 转录 mp3(语音转文本)。不过,我不知道这是否可能。

是吗?如何?

4

2 回答 2

2

pyspeech 似乎只是常规 Windows 语音 API 的 python 接口。您很可能会创建一些方法,将 mp3 播放视为该语音 API 收听的音频源。

于 2011-01-06T03:10:40.017 回答
2

我不了解 pyspeech,但如果它是围绕 Microsoft 语音 API 的 Python 包装器,那么其他一些帖子可能会有所帮助。

Microsoft 语音引擎不需要麦克风输入。他们可以接受音频文件。

如果您要进行转录,则需要听写语法。听写语法包含在随 Windows 7 和 Vista 一起提供的 Microsoft 语音引擎的客户端版本中。Microsoft 提供的服务器引擎上不提供听写语法。

在 C# 中使用带有 System.Speech 命名空间的听写语法的一个简单示例是 StackOverflow 问题SAPI 和 Windows 7 问题

于 2011-01-07T13:46:28.007 回答