当前技术的所有语音到文本算法都是实时运行的吗?我不是指一个人坐在电脑前拿着麦克风,而是输入一个预先录制的音频文件。
ie 如果你有一个 30 分钟的录音,是否总是需要 30 分钟才能被转录?
有不同的方法吗?
当前技术的所有语音到文本算法都是实时运行的吗?我不是指一个人坐在电脑前拿着麦克风,而是输入一个预先录制的音频文件。
ie 如果你有一个 30 分钟的录音,是否总是需要 30 分钟才能被转录?
有不同的方法吗?
没有什么比实时更快地阻止算法运行。Naturally speak 10 Professional 软件程序提供“从文件转录”选项,用于转换离开计算机时的听写,其运行速度与运行它的计算机一样快。
我相信批处理实现存在于信号智能领域,但这样的程序自然不会被普通大众使用。
没有理由说语音识别必须花费与要执行的音频长度一样长的时间。但是,由于需要计算,我认为您不会获得比实时算法快得多的算法。有关更多详细信息,请参阅Wikipedia 文章的这一部分(它似乎没有给出任何时间,尽管它确实给出了一个不错的性能概述)。