将这些声明行添加到文件末尾的“context.pbtxt”。这里的“inp”和“out”是存在于 syntexnet 根目录中的文本文件。
input {
name: 'inp_file'
record_format: 'english-text'
Part {
file_pattern: 'inp'
}
}
input {
name: 'out_file'
record_format: 'english-text'
Part {
file_pattern: 'out'
}
}
将句子添加到您希望为其完成标记的“inp”文件中,并在下次使用 --input 和 --output 标签运行 syntaxnet 时在 shell 中指定它们。
只是为了帮助您多一点,我正在粘贴一个示例 shell 命令。
bazel-bin/syntaxnet/parser_eval \
--input inp_file \
--output stdout-conll \
--model syntaxnet/models/parsey_mcparseface/tagger-params \
--task_context syntaxnet/models/parsey_mcparseface/context.pbtxt \
--hidden_layer_sizes 64 \
--arg_prefix brain_tagger \
--graph_builder structured \
--slim_model \
--batch_size 1024 | bazel-bin/syntaxnet/parser_eval \
--input stdout-conll \
--output out_file \
--hidden_layer_sizes 512,512 \
--arg_prefix brain_parser \
--graph_builder structured \
--task_context syntaxnet/models/parsey_mcparseface/context.pbtxt \
--model_path syntaxnet/models/parsey_mcparseface/parser-params \
--slim_model --batch_size 1024
在上述脚本中,第一个 shell 命令的输出(POS 标记)用作第二个 shell 命令的输入,其中两个 shell 命令用“|”分隔