1

我正在开发一种.srt在浏览器中编辑(字幕)文件的工具(该工具用于语言注释)。在用于类似目的的桌面工具中,用户可以访问波形,并且可以“看到”信号中的静音位置,从而选择特定的短语进行转录。

这样的工具可能会在未来的浏览器中构建(例如,使用 Web Workers 和 Canvas),但目前,进行寻找那些静默所需的那种信号处理是不可行的。

所以,我正在考虑下一个最佳方法:我可以使用什么免费工具来生成静音(低于某个给定阈值)开始和停止的时间戳列表?如果我离线生成这样的列表并将其与音频文件一起上传,那么我至少可以浏览“短语”(定义为非沉默期)。我认为这仍然是转录工作效率的胜利。

Audacity 可以做到这一点,但 AFAICT,只有在你安装 Nyquist 的情况下,这似乎有一些专利问题。

有没有其他选择?

如果该工具可以处理尽可能多的 ogg、mp3 和 wav 文件,那就太好了。

4

0 回答 0