5

我正在尝试找到一种将音频文件转录为文本的简单方法(对于不了解语音识别、配置语言模型、声学模型等的人来说,CMU Sphinx、Julius 等很难)。

我想知道是否有办法将我的音频文件传送到 Mac OS 10.9 Mavericks 的“增强听写”功能中,该功能允许本地离线语音听写。

当我将一根跳线从耳机插孔插入线路时,我认为我很聪明,但不幸的是,当您开始听写时,它会使所有其他音频播放静音(有关如何禁用此静音的任何建议都会得到我的正确答案)。

4

3 回答 3

3

我还没有找到这样做的直接方法。但是,您可以使用 Soundflower 作为解决方法。

例如,您可以在 VLC 中为您的输出选择 Audio->Audio Device->Soundflower (2ch)。然后在 System Preferences->Dictation & Speech->Dictation->Soundflower (2ch) [在麦克风图标下下拉]。然后您可以在 VLC 中开始播放,并开始听写听写(例如在 TextEdit 中),您应该会看到转录出现。这种方法的缺点是速度慢(仅限于音频的实时播放),并且不利于自动化工作流程。

注意:您必须在切换到 TextEdit 和启动 ED 之前开始音频播放。

于 2013-11-05T13:35:24.133 回答
1

macOS 10.15 (Catalina) 中出现了一个 API,它可以访问底层语音系统并允许从音频文件或设备(包括麦克风)转录。由于它也可以从 iOS 10 开始使用,我猜它已被移植到 Mac 上。

它有一些限制。首先,它将其数据传递到 Apple 的服务器进行转录,这可能对您很重要(听写曾经有一个设备上的选项,但在 Catalina 中可能已经消失了?)。可能正因为如此,它在不超过一分钟的时间内处理音频。

有关 API,请参阅语音

于 2020-03-30T16:10:03.890 回答
-2

我使用 Dragon Dictate 的解决方法是使用带麦克风的 USB 耳机。我听我想转录的文件并重复我听到的内容。它很笨拙,但也可以使用,并且也可以与 Dictation 一起使用。如果您可以将文件以较慢的速度播放到耳机中,以便您有时间处理所听到的内容并清晰地重复播放,这将很有帮助。

于 2013-10-30T16:16:23.250 回答