1

我不确定用于单词关系分类的最佳算法是什么。例如,在“The yellow sun”这样的句子中,黄色和太阳之间存在关系。到目前为止,我考虑过的机器学习技术是贝叶斯统计、粗糙集、模糊逻辑、隐马尔可夫模型和人工神经网络。

请问有什么建议吗?

谢谢你 :)

4

4 回答 4

5

听起来您正在寻找依赖项解析器。这样的解析器将为您提供句子中任何单词与其语义或句法头之间的关系。

MSTParser使用称为MIRA的在线最大边距技术对单词之间的关系进行分类。MaltParser包的作用相同,但使用 SVM 做出解析决策。这两个系统都是可训练的,并提供相似的分类和附件性能,请参见此处的表 1 。

于 2010-03-08T21:15:42.563 回答
2

斯坦福解析器完全符合您的要求。甚至还有一个在线演示。这是您的示例的结果。

Your sentence
The yellow sun.

Tagging
The/DT yellow/JJ sun/NN ./.

Parse
(ROOT
  (NP (DT The) (JJ yellow) (NN sun) (. .)))

Typed dependencies
det(sun-3, The-1)
amod(sun-3, yellow-2)

Typed dependencies, collapsed
det(sun-3, The-1)
amod(sun-3, yellow-2)

从您的问题来看,您似乎对类型化的依赖项感兴趣。

于 2010-03-09T23:04:21.057 回答
2

就像用户 dmcer 指出的那样,依赖解析器将为您提供帮助。你可以阅读大量关于依赖解析的文献。这本书这些讲义是介绍传统方法的良好起点。

Link Grammar Parser 有点像依赖解析,它使用 Sleator 和 Temperley 的 Link Grammar 语法来生成词-词链接。您可以在原始链接语法页面和更新的Abiword 页面上找到更多信息(Abiword 现在维护实现)。

对于依赖解析的非常规方法,您可以阅读这篇论文,该论文模拟了类似于化学/物理学中亚原子粒子相互作用的词-词关系。

于 2010-03-08T21:37:52.407 回答
1

好吧,没有人知道语言处理的最佳算法是什么,因为它还没有被解决。能够理解人类语言就是创造一个完整的人工智能。

然而,当然,有人尝试处理自然语言,这些可能是这类事情的良好起点:

X-Bar 理论

短语结构规则

Noam Chomsky 在自然语言处理方面做了很多工作,所以我建议您查阅他的一些工作。

于 2010-03-08T16:45:29.737 回答