2

我想在我的正则表达式中使用 Unicode。

例如,RegExp="\u0061" 匹配“a”。但似乎 dk.brics.automaton 不支持这一点。结果匹配“u0061”。我还尝试了 RegExp="\u0061" 和 RegExp="\\u0061"。没有一个会起作用。

如果您对这个工具有任何经验,您能给我一些解决方案吗?

谢谢!

4

2 回答 2

1

最后,我找到了绕过这个问题的方法。

首先,我们可以在 Java 代码中使用 Unicode,但它必须单独创建。例如,String str = "\u0061"+"b";虽然String str = "\u0061b";不能很好地工作。

其次,如果我们想从文本文件中读取字符串,例如包含“ \u0061b\u0063”的 test.txt,我们必须(据我所知)手动将 Unicode 替换为相应的符号,因为它们是混合的。然后我们可以得到String str值“abc”。

于 2012-04-08T22:00:11.650 回答
0

我在dk.brics.automaton方面没有经验,但我想FAQRegExp Class 的 JavaDoc 中都说了。

据我了解,您可以使用 unicode 字符,但您必须将它们表示为字符(“a”)而不是使用\u0061符号。

于 2012-04-05T12:15:07.193 回答