我想用WordNet做一个关于查询扩展的项目,但是很难找到一步一步的方法来做。
基于这篇文章,我应该采取以下步骤(假设一个句子作为程序的输入):
- 代币化
- 标注词性
- 词干
- 词义消歧
- 两个同义词集之间的语义相似性(仍然令人困惑)
...然后我们可以得出结论,得分较大的单词是输入的查询扩展。但是,我仍然对如何执行这些步骤感到困惑。有没有更详细的资料来源?
查询扩展本身就是 IR(信息检索)下的一个巨大领域。
此外,WordNet 本身就很大,因此很难找到单一的逐步方向。但是,有大量非常好的资源。我从几个网络示例开始自己尝试。
您会发现对入门很有用的资源。
希望这可以帮助您继续前进。