0

我在文档中没有找到任何关于向标记器添加更多标记词的内容,特别是双向词。谢谢

4

2 回答 2

1

目前,你不能。模型训练是一次性操作。(由于标注器使用考虑上下文和频率的权重,因此事后向其添加新词并非易事。)

于 2011-05-13T05:04:15.423 回答
0

有一种解决方法。它很难看,但应该可以解决问题:

  • 建立一个“你的”单词列表
  • 扫描这些单词的文本
  • 如果找到任何与 POS 标记自己匹配的内容(NLTK 可以在此处为您提供帮助)
  • 将其提供给斯坦福解析器。

FROM: http://www.cs.ucf.edu/courses/cap5636/fall2011/nltk.pdf “你也可以给它 POS 标记的文本;如果它们有意义,解析器会尝试使用你的标签。你可能想要如果解析器在您的文本域中出现标记错误,请执行此操作。”

于 2013-11-05T02:32:54.787 回答