我们正在尝试实现一种语义搜索算法,以根据用户的搜索词给出建议的类别。
目前我们已经实现了朴素贝叶斯概率算法来返回我们数据中每个类别的概率,然后返回最高的概率。
然而,由于它的幼稚,它有时会得到错误的结果。
如果不涉及神经网络和其他极其复杂的东西,我们可以研究另一种选择吗?
我们正在尝试实现一种语义搜索算法,以根据用户的搜索词给出建议的类别。
目前我们已经实现了朴素贝叶斯概率算法来返回我们数据中每个类别的概率,然后返回最高的概率。
然而,由于它的幼稚,它有时会得到错误的结果。
如果不涉及神经网络和其他极其复杂的东西,我们可以研究另一种选择吗?
朴素贝叶斯 (NB) 与逻辑回归没有太大区别。根据经验,逻辑回归在大多数情况下在预测性能方面都优于 NB。
此外,如果您有足够的数据并且没有任何缺失数据,那么您很可能会发现 NB 的预测性能与更复杂的方法几乎相同,例如贝叶斯网络 (BN),后者没有协变量之间的“幼稚”独立假设。
如果您想放松独立性假设而不必完全深入 BN 领域,您可以先尝试Tree Augmented Naive Bayes算法。
如果你不认为线性 SVM 是非常复杂的东西,你可以试试。众所周知,它可以很好地完成此类任务。