6

我有一个音频流,我会从中提取单词(语音)。例如,如果有 audio.wav,我会得到 001.wav、002.wav、003.wav 等,其中每个 XXX.wav 是一个单词。

我正在寻找一个库或程序来做这件事——平台无关紧要,但我更喜欢开源解决方案。

提前感谢您的帮助。

4

1 回答 1

2

制作Dragon Naturally Speech的公司Nuance拥有许多软件开发工具包

音频挖掘套件似乎符合您的要求:

Dragon NaturallySpeaking SDK AudioMining 是一个独立于说话者的语音识别工具包,可以对音频文件中 100% 的语音信息进行索引。该技术使用高度准确的语音识别将音频文件转换为带有时间戳信息的 XML 文本。这可以与标准文本搜索产品集成,以实现对特定音频内容的快速访问。

语音到语音+元数据是最难做对的部分。一旦有了语音 + 元数据,将单词提取为单独的音频文件就简单多了

于 2010-07-06T12:08:40.993 回答