我想在我的正则表达式中使用 Unicode。
例如,RegExp="\u0061" 匹配“a”。但似乎 dk.brics.automaton 不支持这一点。结果匹配“u0061”。我还尝试了 RegExp="\u0061" 和 RegExp="\\u0061"。没有一个会起作用。
如果您对这个工具有任何经验,您能给我一些解决方案吗?
谢谢!
最后,我找到了绕过这个问题的方法。
首先,我们可以在 Java 代码中使用 Unicode,但它必须单独创建。例如,String str = "\u0061"+"b";
虽然String str = "\u0061b";
不能很好地工作。
其次,如果我们想从文本文件中读取字符串,例如包含“ \u0061b\u0063
”的 test.txt,我们必须(据我所知)手动将 Unicode 替换为相应的符号,因为它们是混合的。然后我们可以得到String str
值“abc”。
我在dk.brics.automaton方面没有经验,但我想FAQ和RegExp Class 的 JavaDoc 中都说了。
据我了解,您可以使用 unicode 字符,但您必须将它们表示为字符(“a”)而不是使用\u0061
符号。