按照此处的说明为西班牙语-Ancora UD 语料库训练我自己的 SyntaxNet 模型并没有给我错误。
在所有步骤之后,它创建的最终文件是:
-category-map
-char-map
-checkpoint
-context
-graph
-label-map
-latest-model
-latest-model.meta
-lcword-map
-model
-model.meta
-prefix-table
-status
-suffix-table
-tag-map
-tag-to-category
-tagged-dev-corpus
-tagged-training-corpus
-tagged-tunning-corpus
-word-map
用于训练的 context.pbtxt 文件是来自 syntaxnet/models/parsey_universal 的文件。
然后,当我尝试parser.sh
从 syntaxnet/models/parsey_universal 调用测试它时返回几个错误:
F syntaxnet/term_frequency_map.cc:63] Check failed: ::tensorflow::Status::OK() == (tensorflow::Env::Default()->NewRandomAccessFile(filename, &file)) (OK vs. Not found: syntaxnet/models/parsey_universal/modeltest/char-ngram-map)
F syntaxnet/term_frequency_map.cc:63] Check failed: ::tensorflow::Status::OK() == (tensorflow::Env::Default()->NewRandomAccessFile(filename, &file)) (OK vs. Not found: syntaxnet/models/parsey_universal/modeltest/morphology-map)
然后我从这里下载了西班牙预训练模型。我检查了文件。似乎有两个文件丢失,预训练模型默认有它,但在我训练的那个文件中,这些文件丢失了。
所以我的问题是如何在 SyntaxNet 训练阶段获取这些文件?
还有其他方法可以生产它们吗?
我应该以不同的方式对其进行测试吗?