我需要关联属于共同主题的数学术语。例如,角度、cos、tan 等应该与三角学有关。因此,当用户搜索角度、三角形等时,搜索也应该显示与三角相关的结果。任何人都可以提供有关如何在 Apache Lucene 中执行此操作的线索吗?
问问题
258 次
3 回答
2
有一个分类 api,其中包括K-最近邻和朴素贝叶斯模型。
您将首先在train()
您的训练集上使用该方法。训练分类器后,使用该assignClass()
方法对给定字符串进行分类。
对于训练集,您可以使用给定课程的 Wikipedia 页面。
在你尝试了这两个之后,你可以使用Classifier接口来构建一个竞争模型。
于 2013-06-13T15:23:19.713 回答
0
如果您已经知道这些关联,您可以将它们添加到特定术语的索引中——即将'cos' 索引为'cos'、'trigonometry'。
此外,如果您知道关联,您可以索引父项和所有同级项——即将“cos”索引为“三角”、“cos”、“sin”等。这听起来更像你想要的。
于 2013-06-14T19:57:26.123 回答
0
除了@Josh S. 的好答案,您还可以采取更直接的方法,生成您自己的同义词词典,例如,请参阅Match a word with similar words using Solr?
于 2013-06-19T09:53:40.163 回答