0

我目前正在查看 opennlp 源代码,试图找到/理解它们用于分块的语法。这不是最简单的任务之一。我开始浏览 chunkermodel 和相关的类,但还没有走得太远..

有没有人搜索过这个?如果是这样,有什么建议或想法会让我走上正轨吗?

4

1 回答 1

1

实际上,与 Apache OpenNLP 捆绑的算法是基于机器学习技术,使用统计方法。模型中没有语法,而是从训练数据中提取的参数。

要了解有关算法的更多信息,我推荐 Jurafsky 和 ​​Martin 的书“语音和语言处理”,第 6.7 节。

你也可以参考 Ratnaparkhi 的论文:Maximun Entropy Models for Natural Language Ambiguity Resolution

对于感知器 HMM,Michael Collins 的论文:隐马尔可夫模型的判别训练方法:感知器算法的理论和实验

如果您要寻找的是语法方法,请尝试使用 Contraint Grammar 形式主义。VISL 网站列出了一些出版物。

于 2012-04-20T14:31:29.450 回答