7

是否有任何免费服务/程序可以将音频转录为文本并保留时间戳?

我想转录:

这是 VoiceBase 的演示链接

(419 个骗子之间的 16m 对话;骗子说话时口音很重,所以我不抱怨转录的质量)。

Voicebase 会转录它,但转录是单个测试块,并且没有时间戳。

我还尝试了 Google 语音“技巧”(将文件录制到语音邮件中并让 Google 一次转录 3 分钟),但同样,转录是单个文本块,没有时间戳。

我知道狮身人面像,但无法让它工作。

我意识到我可以使用 subtitleeditor 来创建手动转录,但我正在寻找一个自动化的解决方案。

理想情况下,我想采用带有时间戳的机器转录并手动编辑它。

4

3 回答 3

4

CMUSphinx 可以做到这一点,只需从源代码运行 Aligner 演示。sphinx4 教程中提供了最新的 sphinx4 教程。2014 年夏天,CMUSphinx 在 sphinx4 主干中集成了长音频对齐功能。

这是完全错误的,但与语音库不同,它至少捕获了一些单词。手动转录它并稍后分配时间可能更容易。CMUSphinx 也可以通过音频到文本的对齐来做到这一点。

口音和短话引起的解码准确性有很多问题,但您也有责任。例如,您永远不应该将 8khz 带宽的电话音频转换为 mp3。这种转换大大降低了自动语音识别的准确性和整体录音质量。您可以使用其他面向语音的无损编解码器进行压缩。

讨论该主题的其他问题,列出一些建议。

于 2013-04-01T13:37:02.003 回答
0

一个名为 Speechlogger ( https://speechlogger.appspot.com ) 的新软件 (chrome web-app) 正是为此目的而开发的。它保留时间戳,并允许您导出为srt (captions) 格式

它应该是目前最好的技术,因为它利用了谷歌的语音识别引擎。它还自动标点符号(基于简单的单词内容和结构)。

于 2014-10-04T17:58:30.257 回答
0

在 Google 中搜索时,您会得到一长串由市场专业人士提供支持的转录软件。其中一些例子是:

  1. 快递抄写员
  2. EureScribe
  3. 抄写员

但是使用自动化软件时出现的问题是它不能提供我们需要的确切结果。因此,如果您在使用这些软件时仍然遇到任何问题,那么您可以聘请抄写员来简化您的工作。

于 2013-12-26T11:21:22.963 回答