regex - 我可以在正则表达式引擎 dk.brics.automaton 中使用 Unicode 吗？

Question

我想在我的正则表达式中使用 Unicode。

例如，RegExp="\u0061" 匹配“a”。但似乎 dk.brics.automaton 不支持这一点。结果匹配“u0061”。我还尝试了 RegExp="\u0061" 和 RegExp="\\u0061"。没有一个会起作用。

如果您对这个工具有任何经验，您能给我一些解决方案吗？

谢谢！

score 1 · Accepted Answer

最后，我找到了绕过这个问题的方法。

首先，我们可以在 Java 代码中使用 Unicode，但它必须单独创建。例如，String str = "\u0061"+"b";虽然String str = "\u0061b";不能很好地工作。

其次，如果我们想从文本文件中读取字符串，例如包含“ \u0061b\u0063”的 test.txt，我们必须（据我所知）手动将 Unicode 替换为相应的符号，因为它们是混合的。然后我们可以得到String str值“abc”。

score 0 · Accepted Answer

我在dk.brics.automaton方面没有经验，但我想FAQ和RegExp Class 的 JavaDoc 中都说了。

据我了解，您可以使用 unicode 字符，但您必须将它们表示为字符（“a”）而不是使用\u0061符号。

2 回答 2