0

我在训练 SyntaxNet POS 标记器和解析器训练时遇到了一些困难,我可以找到一个很好的解决方案,我在 Answers 部分提到了这个解决方案。如果您遇到以下问题之一,此文档确实可以帮助您:

  1. Universal Dependencies引入的训练、测试和调优数据集都是.conllu格式的,我不知道如何将格式更改为.conll文件,而且在我找到之后conllu-formconvert.pyconllu_to_conllx.pl我仍然不知道如何使用它们。如果你有这样的问题,文档有一个名为的 python 文件convert.py,它在主体中调用,train.sh并将[train_p.sh][5]下载的数据集转换为 SyntaxNet 的可读文件。
  2. 每当我运行 bazel 测试时,我被告知在 stackoverflow问题和答案之一上运行 bazel 测试,parser_trainer_test.sh它失败了,然后它给了我这个错误test.logpath to save model cannot be found : --model_path=$TMP_DIR/brain_parser/greedy/$PARAMS/ model

该文档将火车 POS 标记器和 PARSER 分开,并展示了如何在parser_trainer和中使用不同的目录parser_eval。即使您不想使用它自己的文档,您也可以根据它更新您的文件。3. 对我来说训练解析器花了一天所以不要惊慌它需要时间“如果你不使用使用 gpu 服务器” disinex说

4

1 回答 1

4

我从Disindex的github得到了一个答案,我发现它非常有用。https://github.com/dsindex/syntaxnet中的文档包括:

convert_corpus
train_pos_tagger
preprocess_with_tagger

正如Disindex所说,我引用:“我以为你想训练 pos-tagger。如果那样,运行./train.sh

于 2016-06-06T12:51:23.993 回答