我想知道 Apache Lucene 使用的字符串匹配算法。我一直在浏览这里给出的 lucene 使用的索引文件格式。似乎 lucene 存储文本中出现的所有单词,就像它们在每个文档中出现的频率一样。但据我所知,为了有效的字符串匹配,它需要预处理文档中出现的单词。
示例:搜索“iamrohitbanga 是 stackoverflow 的用户”(使用模糊匹配)
在一些文件中。
可能存在包含字符串“rohit banga”的文档
要发现搜索字符串中存在子字符串 rohit 和 Banga,它将使用一些有效的子字符串匹配。
我想知道它是哪种算法。如果它做了一些预处理,java api中的哪个函数调用会触发它。