我在 ubuntu 11.10 上使用 pocketsphinx python 绑定。我将语法和音频文件传递给它,它运行良好。我现在正在寻找音频文件中每个单词的时间戳。我见过:
void ps_seg_frames(ps_seg_t *seg, int *out_sf, int *out_ef);
我相信应该做我需要的。但是我似乎无法在python中找到这样做。这可能吗?
此功能尚未实现。这里有一个补丁,但似乎由于 sourceforge 中断而丢失
https://sourceforge.net/tracker/?func=detail&atid=301904&aid=3480256&group_id=1904
添加这个绑定应该比较容易