7

有人可以推荐用于韩语、印尼语、泰语和越南语的开源 POS 标记器吗?

我可以用它来标记我目前拥有的语料库数据。(例如stanford-postagger

如果您是开发人员并且愿意分享并让我测试 POS 标记器,我也不介意。

通过对输出的一些修改,我用jvntextpro对越南数据进行了 POS 标记

但我仍然希望对韩语、印尼语和泰语 POS 标记有更多意见。

4

2 回答 2

5

在 acl wiki 之后:韩语形态分析器和词性标注器

我会开始看韩国、泰国和韩国的NLP研究部门的网站。在此页面上,您将找到研究部门的链接。

祝你好运!

更新:OpenNLP有泰国 PoS。以下是模型:http : //opennlp.sourceforge.net/models/thai/ 用于 PoS opennlp 标记器。

于 2011-04-14T19:31:09.787 回答
0

您可能想尝试RDRPOSTagger:用于 POS 和形态标记的强大、易于使用且与语言无关的工具包。

(编程语言:Python & Java)

RDRPOSTagger 在学习和标记过程中都获得了快速的性能。此外,与最先进的结果相比,RDRPOSTagger 实现了极具竞争力的准确性。请参阅本文中的实验结果,包括性能速度和标记精度。

RDRPOSTagger 现在支持 13 种语言的预训练 POS 和形态标记模型,包括泰语和越南语。

于 2015-11-20T07:47:13.337 回答