我一直在研究一种用 Javascript 转录语音录音的工具。基本上,我正在连接关键事件以播放、暂停和循环使用audio
标签读取的文件。
有许多先进的现有桌面应用程序可用于执行此类操作(例如Transcriber - 这是一个屏幕截图)。大多数转录工具都有一个内置的波形,可用于在音频文件中跳转,这非常有帮助,因为转录者可以学习视觉查找和重复或循环短语。
我想知道是否可以使用 Javascript 在浏览器中模拟此功能的子集。我对信号处理了解不多,也许它甚至不可行。
但我设想的是 Javascript 从文件中读取声音流,并定期对幅度进行采样。如果幅度非常低的时间超过某个阈值时间,那么这将被标记为短语中断。
我认为,这种标记对于转录非常有用。然后我可以设置关键命令来跳转到之前的静音期。所以假设(想象一个基于 jQuery 的 API):
var audio = $('audio#someid');
var silences = silenceFindingVoodoo(audio);
silences
然后将包含一个时间列表,所以我可以连接一些方法让用户在各种silence
s 中跳转,然后将 设置currentTime
为一个选定的值,然后播放它。
甚至可以想象用 Javascript 做这种事情吗?