3

我希望为音频文件中的每个单词获得大致准确的时间戳。我也有原始文本与音频文件一起使用,可以用作各种交叉引用源。这类似于“音频挖掘”,我相信你只有输入音频,而这里我有音频和文本。

理想情况下,我希望使用开源软件来执行此操作,并希望接受大多数语言作为输入(例如,英语、法语、德语、西班牙语,最好是俄语和普通话)。

我什至会接受只能匹配各种单词的时间戳的解决方案(例如,如果转录不完全准确)。然后将输出文本与原始文本交叉引用以帮助重新调整内容会更容易。

4

1 回答 1

0

在我的语言学研究中,我确实是这样工作的。我使用了一个名为 ELAN 的程序,我刚刚注意到它们的版本 (4.5) 比我目前在我的 Mac 上安装的版本更新。该软件旨在帮助处理聋人语言,因此它支持视频和音频帧,并允许您准确对齐您的转录。我使用的版本是 3.9,该版本用于对单词进行某种自动分割,这正是我认为你想要做的。不过,我在最新版本中没有看到该功能,也许经过一些挖掘,它仍然存在。

分割音频和视频这个页面

当然如果你需要更早的版本,你总是可以使用 ELAN 3.9。ELAN 可以在 Mac、Linux 和 Windows 上运行,因为它是基于 Java 的(我记得)。这是ELAN的链接。还有其他语言注释软件。另一个非常好,但很难学习。它被称为PRAAT

我希望这可以帮助你。如果我不能正确理解您的需求,请告诉我,我会看看是否可以为您完善我的答案。干杯!

于 2013-02-07T19:10:50.390 回答