我正在开发一个使用 MySQL 和自然语言模式的信息检索系统。我拥有的数据被注释为考虑不同的类别。例如。猴子、猫、狗将被注释为“动物”,而鸭、麻雀将被注释为“鸟”。问题是我正在根据这些标签的出现来检索文档。
现在 MySQL 有一个限制,如果某个特定术语在整个数据中超过 50%,则不考虑该术语。考虑到我的要求,我希望它对所有匹配的术语进行评分,即使特定术语在整个数据中的占比超过 50%。
我已经阅读了一些关于将 Sphinx 与 MySQL 结合以提高搜索效率的内容,但我不确定这是否适用于我的情况。
请提供此问题的解决方案