3

我正在使用 ElasticSearch 和 Tire.rb 来索引和搜索我的项目集合。

我想查询索引中的名称字段。

如果我有一份名为Alfa Romeo的文件,我想通过以下搜索找到该文件:

  1. “阿尔法”
  2. “Alfa Remeo”(注意拼写错误)

在 ElasticSearch 和轮胎中,我知道如何分别设置两个查询:

使用通配符搜索:

Model.tire.search do
  query do
    boolean do
      must { string "#{myquerystring}*", default_field: 'name' }
    end
  end
end

模糊搜索(Levenshtein 距离):

Model.tire.search do
  query do
    boolean do
      must { text :name, { query: mysquerystring, operator: 'AND', fuzziness: 0.4 } }
    end
  end
end

如何结合(与或)?

我想要做的是找到通配符或模糊搜索匹配的所有文档。我可以进行两次单独的搜索并尝试将它们组合起来,但这没有多大意义。我可以以某种合乎逻辑的方式做到这一点吗?

4

2 回答 2

3

正如 David 所建议的那样,您可以将bool 查询minimum_number_should_match.

但这里有一些关于查询字符串中通配符的想法。

在您的情况下,前缀查询查询字符串更可取:

  • 查询字符串中的通配符比前缀查询慢
  • *在用户提供的查询末尾手动添加 - 明确指示您要使用前缀查询(专为此而设计)

在轮胎中,这是一个完整的例子:

require 'tire'


class Car
  include Tire::Model::Persistence

  property :name, type: "multi_field",
                    fields: {
                      name:  { type: 'string', analyzer: 'snowball'  },
                      exact: { type: 'string', index:    'not_analyzed' }
                    }

end

Car.index.delete
Car.create_elasticsearch_index

Car.create name: 'Alfa'
Car.create name: 'Alfa Romeo'
Car.index.refresh

queries = [ 'Alfa', 'Alf', 'Alfa Remeo', 'Remeo' ] # Notice the spelling mistake

puts "Searching for: #{queries.join(', ')}", "="*80, ""

queries.each do |q|

  s = Car.search do
    query do
      boolean minimum_number_should_match: 1 do
        should { prefix 'name', q  }
        should { prefix 'name.exact', q, boost: 10 }
        should { match :name, q, operator: 'AND', fuzziness: 0.4 }
      end
    end
  end

  puts "Found #{s.results.size} results for query '#{q}':",
      "-"*80,
       s.map { |d| "#{d.name} (score: #{d._score})" }.join(", "),
       ""
end

结果:

Searching for: Alfa, Alf, Alfa Remeo, Remeo
================================================================================

Found 2 results for query 'Alfa':
--------------------------------------------------------------------------------
Alfa (score: 0.67262733), Alfa Romeo (score: 0.67027444)

Found 2 results for query 'Alf':
--------------------------------------------------------------------------------
Alfa (score: 0.6693944), Alfa Romeo (score: 0.66834825)

Found 1 results for query 'Alfa Remeo':
--------------------------------------------------------------------------------
Alfa Romeo (score: 0.08865173)

Found 1 results for query 'Remeo':
--------------------------------------------------------------------------------
Alfa Romeo (score: 0.06392767)
于 2012-09-24T20:11:48.127 回答
2

将布尔查询与应该查询一起使用怎么样:http ://www.elasticsearch.org/guide/en/elasticsearch/reference/current/query-dsl-bool-query.html ?

它是否符合您的用例?

大卫

于 2012-09-20T23:14:23.260 回答