我在文档中没有找到任何关于向标记器添加更多标记词的内容,特别是双向词。谢谢
问问题
290 次
2 回答
1
目前,你不能。模型训练是一次性操作。(由于标注器使用考虑上下文和频率的权重,因此事后向其添加新词并非易事。)
于 2011-05-13T05:04:15.423 回答
0
有一种解决方法。它很难看,但应该可以解决问题:
- 建立一个“你的”单词列表
- 扫描这些单词的文本
- 如果找到任何与 POS 标记自己匹配的内容(NLTK 可以在此处为您提供帮助)
- 将其提供给斯坦福解析器。
FROM: http://www.cs.ucf.edu/courses/cap5636/fall2011/nltk.pdf “你也可以给它 POS 标记的文本;如果它们有意义,解析器会尝试使用你的标签。你可能想要如果解析器在您的文本域中出现标记错误,请执行此操作。”
于 2013-11-05T02:32:54.787 回答