我对 nlp 很陌生,我正在尝试找出 pos 标记。目前我正在试用 stanford nlp pos tagger,网址: http: //nlp.stanford.edu/software/tagger.shtml
从上面的链接,有这句话:
给定语言的 POS 注释训练文本,可以在任何语言上重新训练标注器。
但是,我无法让它工作。我现在所能做的就是给它一个文本文件来标记。例如String test = "this is a test";
将返回我 this_DT is_VBZ a_DT test_NN。
我该如何重新训练标记器?假设我希望将上述字符串作为 this_DT is_VBZ a_DT test_VB 返回?
感谢这里的任何答案。