1

我是 ES 的新手。

我有 3000 个关键字,需要将它们与数百万个具有 url 编码字符(如“+”)的 URL 匹配。

喜欢

www.nicecars.com/BrownCars_Nice_Sedan_with-Wheels_4+
www.nicecars.com/BrownCars_Nice_Sedan_with-Wheels_4

品牌在哪里BrownCars

到目前为止,最好的工作分析器是pattern但它放弃了+这很重要。

那么我怎样才能取消过滤字符+呢?

还是有更好的分析器来完成这项任务?

4

1 回答 1

0

您可以自定义模式分析器,并且在 Char 过滤器中不要过滤+.

分析过程包括以下三个步骤:

  1. 字符过滤器(您可以在此处添加/删除文本中的某些字符)
  2. Tokenizer(将文本分解为标记)
  3. 令牌过滤器(将令牌转换为小写等)

提供您的模式分析器定义会很有用,因此我们可以从我们这边进行测试并根据您的需要进行修改。

于 2019-03-11T03:58:22.593 回答