问题标签 [openfst]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
openfst - OpenFST - 从单词列表中创建 FST
我正在阅读最重要的示例:关于标记化的http://www.openfst.org/twiki/bin/view/FST/FstExamples 。
在示例中,他们创建了三个 fst:Mars.fst
、Martian.fst
和man.fst
,并手动运行一些 fst 命令以将它们合并为一个大传感器。他们从 中得到“Mars”、“Martian”和“man”三个wotw.syms
词,共有 7102 个词。
我的问题是,有没有一种聪明的方法可以为所有 7102 个单词创建一个word.fst
,以便所有 7102 个单词都可以制成一个大自动机,还是必须手动完成,就像他们为三个单词 Martian、Mars 所做的那样,和男人?
openfst - “错误:fstsymbols:保存符号但没有输出符号”是什么意思,我该如何解决?
我想更新 Vosk 中使用的 Kaldi 模型的语言模型。我正在关注更新Vosk Adaptation中的语言模型
我有这个错误:fstsymbols: Saving osymbols but there are no output symbols when I try to run fstsymbols --save_osymbols=words.txt Gr.fst > /dev/null
。我猜 words.txt 是我想识别的新文本,对吧?
cygwin - 运行脚本 prepare_lang.sh 时出现 Kaldi 错误——GenericRegister::GetEntry: No such file or directory
我正在使用 Kaldi 在我自己的数据集上训练声学模型(遵循Eleanor Chodroff 的本教程)。我在 Windows 10 上使用 Cygwin。当我运行prepare_lang.sh
应该创建文件的脚本时/data/lang
,它会生成以下错误:
未创建这些文件:L.fst, L_disambig.fst, oov.int, oov.txt, topo
该命令的完整输出如下所示:
我从同一个教程中遵循了 Cygwin 的标准 Kaldi 安装,并kaldi/tools
拥有该文件夹openfst-1.7.2
。
我已经在谷歌上搜索了一段时间,但似乎找不到解决方案。我是 Kaldi 的新手,不确定错误的来源,所以我很乐意提供任何其他可能相关的细节。有人可以帮我吗?
makefile - libtool:错误:除非指定了 -no-undefined,否则无法构建 x86_64-w64-mingw32 共享库
我正在尝试使用 MINGW64 和 Msys在 windows10 上构建和安装OpenFst库,但是在使用 make 构建期间出现以下错误。我第一次使用这个命令:
此命令的某些检查结果不会生成:
其他检查结果正常,是的。然后我使用了make命令:
它适用于某些文件,然后因该错误而终止:
这是我第一次使用 MinGW 进行构建。所以,我不知道错误意味着什么,以及是否从负责它的配置中检查结果“否”。
openfst - 如何通过 OpenGrm thrax 输出权重总和?
我是 openfst 和 thrax 的新手。那么有没有办法输出thraxrewrite-tester输出的结果的对应权重(例如string<weight>)。
似乎thraxrewrite-tester --far=tokenizer.far --rules=tokenize --noutput=2
只会输出类似的结果Output string: xxx
。并且thraxrewrite-tester --help
没有给我更多有用的信息。
python - 在 python openfst 中取消设置最终状态
如何更改它以使其s1
不再是最终状态?
python - 如何根据 Open FST 验证输入?
有一个 hacky 方法可以做到这一点:https ://stackoverflow.com/a/54067480/3310334
但是考虑到两年多过去了,有没有更现代的解决方案?
取 'ab' 或 'ba' 并产生 'AB' 或 'BA'。
如何测试某些字符串或序列是否构成有效输入?
如何通过传感器运行输入?