我必须实现一个经过判别训练的监督词性标注器,并且我一直在研究几种技术,包括最大似然、感知器和大边距 (SVM)。最后,在阅读了几篇研究论文中引用的一些实验结果后,我决定使用 SVM。我已经研究了一段时间,理论上有几件事似乎有点令人困惑。有人可以向我指出一些相关的阅读材料来实际实现,或者只是更清楚地说明如何使用维特比算法来实现它。
PS:我不是在寻求解决方案,而只是需要一些指导。
我必须实现一个经过判别训练的监督词性标注器,并且我一直在研究几种技术,包括最大似然、感知器和大边距 (SVM)。最后,在阅读了几篇研究论文中引用的一些实验结果后,我决定使用 SVM。我已经研究了一段时间,理论上有几件事似乎有点令人困惑。有人可以向我指出一些相关的阅读材料来实际实现,或者只是更清楚地说明如何使用维特比算法来实现它。
PS:我不是在寻求解决方案,而只是需要一些指导。
我建议,阅读一些经典论文。
以及在 Python NLTK 中使用 Maxent的分步构建论文:
你也可以学习一些开源软件,比如Apache OpenNLP、Python NLTK或者我自己实现的PurePos