有人可以推荐用于韩语、印尼语、泰语和越南语的开源 POS 标记器吗?
我可以用它来标记我目前拥有的语料库数据。(例如stanford-postagger)
如果您是开发人员并且愿意分享并让我测试 POS 标记器,我也不介意。
通过对输出的一些修改,我用jvntextpro对越南数据进行了 POS 标记
但我仍然希望对韩语、印尼语和泰语 POS 标记有更多意见。
有人可以推荐用于韩语、印尼语、泰语和越南语的开源 POS 标记器吗?
我可以用它来标记我目前拥有的语料库数据。(例如stanford-postagger)
如果您是开发人员并且愿意分享并让我测试 POS 标记器,我也不介意。
通过对输出的一些修改,我用jvntextpro对越南数据进行了 POS 标记
但我仍然希望对韩语、印尼语和泰语 POS 标记有更多意见。
在 acl wiki 之后:韩语形态分析器和词性标注器
我会开始看韩国、泰国和韩国的NLP研究部门的网站。在此页面上,您将找到研究部门的链接。
祝你好运!
更新:OpenNLP有泰国 PoS。以下是模型:http : //opennlp.sourceforge.net/models/thai/ 用于 PoS opennlp 标记器。
您可能想尝试RDRPOSTagger:用于 POS 和形态标记的强大、易于使用且与语言无关的工具包。
(编程语言:Python & Java)
RDRPOSTagger 在学习和标记过程中都获得了快速的性能。此外,与最先进的结果相比,RDRPOSTagger 实现了极具竞争力的准确性。请参阅本文中的实验结果,包括性能速度和标记精度。
RDRPOSTagger 现在支持 13 种语言的预训练 POS 和形态标记模型,包括泰语和越南语。