我已经开始与 Kaldi 合作,并设法在没有任何 GPU 的情况下训练了一些迷你 librispeech 文件。
现在我有一个小的 WAV 文件,我需要弄清楚如何用 Kaldi 解码这个文件。我需要使用哪个解码文件?
很高兴获得任何信息!
干杯,安迪
我已经开始与 Kaldi 合作,并设法在没有任何 GPU 的情况下训练了一些迷你 librispeech 文件。
现在我有一个小的 WAV 文件,我需要弄清楚如何用 Kaldi 解码这个文件。我需要使用哪个解码文件?
很高兴获得任何信息!
干杯,安迪
要解码单个文件,请将其名称放在 scp 文件 decode.scp 中,如下所示:
decoder-test decoder-test.wav
然后解码脚本将如下所示:
online2-wav-nnet3-latgen-faster \
--word-symbol-table=exp/tdnn/graph/words.txt --frame-subsampling-factor=3 --frames-per-chunk=51 \
--acoustic-scale=1.0 --beam=12.0 --lattice-beam=6.0 --max-active=10000 \
--config=exp/tdnn/conf/online.conf \
exp/tdnn/final.mdl exp/tdnn/graph/HCLG.fst ark:decoder-test.utt2spk scp:decoder-test.scp ark:- |
lattice-lmrescore --lm-scale=-1.0 ark:- 'fstproject --project_output=true data/lang_test_rescore/G.fst |' ark:- |
lattice-lmrescore-const-arpa ark:- data/lang_test_rescore/G.carpa ark:- |
lattice-align-words data/lang_test_rescore/phones/word_boundary.int exp/tdnn/final.mdl ark:- ark:- |
lattice-to-ctm-conf --frame-shift=0.03 --acoustic-scale=0.08333 ark:- - |
local/int2sym.pl -f 5 data/lang_test_rescore/words.txt - -
您还可以尝试使用 kaldi-gstreamer 或py-kaldi-asr来简化解码接口。