我是自然语言处理的初学者。我必须研究不同的语言,泰米尔语就是其中之一。请问专家是否有任何泰米尔语标记器代码(java、c、python 等)和我用于研究的词性标记器代码?
如果我能在这里得到一些专家的意见,我真的很感激。任何帮助表示赞赏。
谢谢
我是自然语言处理的初学者。我必须研究不同的语言,泰米尔语就是其中之一。请问专家是否有任何泰米尔语标记器代码(java、c、python 等)和我用于研究的词性标记器代码?
如果我能在这里得到一些专家的意见,我真的很感激。任何帮助表示赞赏。
谢谢
我找到了一种用于标记化Indic NLP Library的工具。它支持泰米尔语。
我发现互联网上没有可用的 POS 标记工具,但我找到了一些论文:
2008 年基于语素的泰米尔语词性标注语言模型
2009 年泰米尔语部分语音标记和分块的 CRF 模型
2009通过投影和归纳技术改进泰米尔语中基于规则的形态分析和词性标注
也许你可以联系作者寻求帮助。
或者如果你会说泰米尔语,在互联网(尤其是大学网站)上搜索泰米尔语,你可能会找到一些资源和工具。