3

这个问题是Java 字符串搜索忽略重音的延续。

原始问题的答案向我们展示了如何从字符串中删除变音符号。因此,例如,köln变为koln。但是łódź变成了 łodz - 注意l 与 stroke

我的问题是我怎样才能删除中风,以便łódź变成lodz

谢谢。

4

2 回答 2

2

你不能,至少对于所有这些字母来说都不是微不足道的。这封信ł(除了外观和它的 Unicode 名称)根本没有链接l(至少在 Unicode 中;从语言上讲,这是另一回事)。

您唯一的选择可能是您的用例的转换表,您可以填写您需要转换的所有字符。

于 2012-05-30T07:48:44.657 回答
1

正如 tchrist 建议的那样,我尝试使用 ICU (V 50.1):它也不认为它是从 L 派生的。带笔划的 L 似乎是 Unicode 中的一个特例。看看http://bugs.mysql.com/bug.php?id=11369 他们说在 Unicode 4.0 中它没有连接到 L,而在 Unicode 4.1 中它是。我想知道是否有人用基于 Unicode4.1 的 Java 库测试了这个问题。

于 2012-11-22T06:57:37.300 回答