我使用 Solr (SolrCloud) 来索引和搜索我的推文。大约有 1600 万条推文,索引大小约为 3 GB。推文在出现时会被实时索引,以便启用实时搜索。目前我使用lowercase
字段类型作为我的推文正文字段。对于搜索中的单个搜索词,大约需要 7 秒,并且随着每个搜索词的添加,搜索所花费的时间线性增加。3GB 是为 solr 进程分配的最大 RAM。示例 solr 搜索查询如下所示
tweet_body:*big* AND tweet_body:*data* AND tweet_tag:big_data
关于提高搜索速度的任何建议?目前我只运行 1 个包含整个推文集合的分片。