我的网站存储了数百万个实体。访问者通过键入仅包含在标题中的单词来搜索实体。标题最多为 100 个字符。
这不是经典文档搜索的情况,用户在大块内搜索。字段非常短。此外,这里的主要问题是性能(而不是相关性),因为实体是“在您键入时”提供的(自动建议)。
更智能的路线是什么?
- 创建一个 MySql 表 [word, entity_id],将 'word' 编入索引,然后使用
select entity_id from search_index where word like '[query_word]%进行查询
这显然需要我将每个标题分解为其单词并为每个单词添加一行单词。 - 使用 Solr 或一些类似的搜索引擎,从我的阅读来看,它更倾向于全文搜索。
另外,如果我以后想介绍拼写建议,这对我有什么影响。
谢谢!