关于在 Lucene 中处理德语变音符号,我有两个问题:
我正在尝试找到一种方法将德语变音符号转换为“ue”、“ae”等形式的折叠形式“u”、“a”等。这是由 GermanAnalyzer(以及它使用的 German2StemFilter)完成的,但不幸的是,它也会进行词干提取,这在我的情况下是非常不希望的。是否有任何其他过滤器只能进行 'ue' -> 'u' 转换?
是否有任何过滤器可以进行 'ü' -> 'ue' (不是 'u' 像 ASCIIFoldingFilter 那样)转换?我想要实现的是,只要用户搜索“über”或“ueber”,就应该在索引中找到“über”这个词,而不是“uber”。