3

我想用WordNet做一个关于查询扩展的项目,但是很难找到一步一步的方法来做。

基于这篇文章,我应该采取以下步骤(假设一个句子作为程序的输入):

  1. 代币化
  2. 标注词性
  3. 词干
  4. 词义消歧
  5. 两个同义词集之间的语义相似性(仍然令人困惑)

...然后我们可以得出结论,得分较大的单词是输入的查询扩展。但是,我仍然对如何执行这些步骤感到困惑。有没有更详细的资料来源?

4

1 回答 1

2

查询扩展本身就是 IR(信息检索)下的一个巨大领域。

此外,WordNet 本身就很大,因此很难找到单一的逐步方向。但是,有大量非常好的资源。我从几个网络示例开始自己尝试。

您会发现对入门很有用的资源。

  1. wordnet 网站本身(带有示例)
  2. WordNet维基百科页面
  3. Python Programming.net 有一个WordNet 教程页面
  4. 即使您不了解 Python,我也强烈推荐 O'Reilly 的书“ Natural Language Processing with Python ”。它的网站上有大量示例可以帮助您入门。

希望这可以帮助您继续前进。

于 2012-11-13T23:00:14.543 回答