1

我需要关联属于共同主题的数学术语。例如,角度、cos、tan 等应该与三角学有关。因此,当用户搜索角度、三角形等时,搜索也应该显示与三角相关的结果。任何人都可以提供有关如何在 Apache Lucene 中执行此操作的线索吗?

4

3 回答 3

2

有一个分类 api,其中包括K-最近邻朴素贝叶斯模型。

您将首先在train()您的训练集上使用该方法。训练分类器后,使用该assignClass()方法对给定字符串进行分类。

对于训练集,您可以使用给定课程的 Wikipedia 页面。

在你尝试了这两个之后,你可以使用Classifier接口来构建一个竞争模型。

于 2013-06-13T15:23:19.713 回答
0

如果您已经知道这些关联,您可以将它们添加到特定术语的索引中——即将'cos' 索引为'cos'、'trigonometry'。

此外,如果您知道关联,您可以索引父项和所有同级项——即将“cos”索引为“三角”、“cos”、“sin”等。这听起来更像你想要的。

于 2013-06-14T19:57:26.123 回答
0

除了@Josh S. 的好答案,您还可以采取更直接的方法,生成您自己的同义词词典,例如,请参阅Match a word with similar words using Solr?

于 2013-06-19T09:53:40.163 回答