这个问题是Java 字符串搜索忽略重音的延续。
原始问题的答案向我们展示了如何从字符串中删除变音符号。因此,例如,köln变为koln。但是łódź变成了 łodz - 注意l 与 stroke。
我的问题是我怎样才能删除中风,以便łódź变成lodz?
谢谢。
这个问题是Java 字符串搜索忽略重音的延续。
原始问题的答案向我们展示了如何从字符串中删除变音符号。因此,例如,köln变为koln。但是łódź变成了 łodz - 注意l 与 stroke。
我的问题是我怎样才能删除中风,以便łódź变成lodz?
谢谢。
你不能,至少对于所有这些字母来说都不是微不足道的。这封信ł
(除了外观和它的 Unicode 名称)根本没有链接l
(至少在 Unicode 中;从语言上讲,这是另一回事)。
您唯一的选择可能是您的用例的转换表,您可以填写您需要转换的所有字符。
正如 tchrist 建议的那样,我尝试使用 ICU (V 50.1):它也不认为它是从 L 派生的。带笔划的 L 似乎是 Unicode 中的一个特例。看看http://bugs.mysql.com/bug.php?id=11369 他们说在 Unicode 4.0 中它没有连接到 L,而在 Unicode 4.1 中它是。我想知道是否有人用基于 Unicode4.1 的 Java 库测试了这个问题。