0

我必须实现一个经过判别训练的监督词性标注器,并且我一直在研究几种技术,包括最大似然、感知器和大边距 (SVM)。最后,在阅读了几篇研究论文中引用的一些实验结果后,我决定使用 SVM。我已经研究了一段时间,理论上有几件事似乎有点令人困惑。有人可以向我指出一些相关的阅读材料来实际实现,或者只是更清楚地说明如何使用维特比算法来实现它。

PS:我不是在寻求解决方案,而只是需要一些指导。

4

1 回答 1

1

我建议,阅读一些经典论文。

  • 众所周知的基于三元组的方法,TnT
  • Ratnaparkhi和他的论文著名的最大熵方法:

以及在 Python NLTK 中使用 Maxent的分步构建论文:

你也可以学习一些开源软件,比如Apache OpenNLPPython NLTK或者我自己实现的PurePos

对于使用 SVM,您可以查看此处此处

于 2012-11-19T12:52:49.347 回答