我正在寻找一个 Java/Scala 库,它可以接受用户查询和文本并返回是否匹配。
我正在处理信息流,即:Twitter Stream,并且无法使用批处理过程,我需要实时评估每条推文,而不是通过 Lucene RAMDisk 对其进行索引并稍后查询。
可以使用ANTLR创建解析器/词法分析器,但这是一种常见的用法,我不敢相信以前没有人创建过库。
TextQuery Ruby 库中的一些示例完全符合我的需要:
TextQuery.new("'to be' OR NOT 'to_be'").match?("to be") # => true
TextQuery.new("-test").match?("some string of text") # => true
TextQuery.new("NOT test").match?("some string of text") # => true
TextQuery.new("a AND b").match?("b a") # => true
TextQuery.new("a AND b").match?("a c") # => false
q = TextQuery.new("a AND (b AND NOT (c OR d))")
q.match?("d a b") # => false
q.match?("b") # => false
q.match?("a b cdefg") # => true
TextQuery.new("a~").match?("adf") # => true
TextQuery.new("~a").match?("dfa") # => true
TextQuery.new("~a~").match?("daf") # => true
TextQuery.new("2~a~1").match?("edaf") # => true
TextQuery.new("2~a~2").match?("edaf") # => false
TextQuery.new("a", :ignorecase => true).match?("A b cD") # => true
一旦它在 Ruby 中实现,它就不适用于我的平台,我也不能仅在我们的解决方案中使用 JRuby:
我发现了一个类似的问题,但无法从中得到答案: Boolean Query / Expression to a Concrete syntax tree
谢谢!