8

我需要验证给定字符串的用户并验证它是一个有效的集合,可能是一个包含内部集合的集合。例子:

 1) {1, 2, 3, 4} = valid
 2) {1, 2, {3, 4}, 5} = valid
 3) 1, 2, 3, 4 = invalid (missing brackets)
 4) {1, 2, {3, 4, 5} = invalid (missing inner bracket)

这是我正在使用的正则表达式(为了便于阅读而分解):

String elementSeparator = "(,\\s)?";
String validElement = "(\\{?[A-Za-z0-9]*\\}?" + elementSeparator + ")*";
String regex = "^\\{" + validElement + "\\}$";

目前它接受带有可选的开始和结束括号的集合,但我需要它只接受它们都在那里,而不是如果内部集合缺少括号。在我当前的实现中,第 4 个示例被接受为有效集合。

我怎样才能做到这一点?

4

3 回答 3

4

这是一些 Java 伪代码,用于在不使用任何重量级工具(如 ANTLR)的情况下解决此问题。基本方法是将输入拆分为由以下组成的标记

  1. 单个打开或关闭大括号
  2. 一个逗号
  3. 空白
  4. 标识符

然后您扫描令牌,随时跟踪嵌套级别。如果到最后嵌套级别不为零,则输入字符串有一个不平衡的大括号。

Pattern token = Pattern.compile("([{}]|,|[A-Aa-z0-9]+|\s+)");
int nesting = 0
Matcher m = token.matcher(inputString);
while(m.find())
{
    if (m.group(1).equals("{")
        nesting++;
    else if (m.group(1).equals("}")
    {
        nesting--;
        if (nesting < 0)
            error - too many right braces
    }
    else
        ....
}
if (nesting != 0) 
    log("incorrect nesting");

一旦你有了这个框架,你就可以增强它来检测连续两个逗号之类的东西:当你看到一个逗号时设置一个标志,当你看到一个标识符(但不是空格)时清除标志。在逗号和右大括号的分支中,您测试标志并发出错误消息,因为此时的逗号无效。依此类推,无论您需要什么验证。

请注意,我上面的伪代码不是一个完整的解决方案,只是为了给您提供一般方法。一个完整的解决方案会涉及更多,因为它必须处理无效字符,从而使词法分析器(将字符串分解为标记的部分)更加复杂。

于 2012-10-31T18:55:17.793 回答
3

由于您使用匹配括号,简单的正则表达式语法是不够的。您需要研究所谓的上下文无关语法。我建议研究 ANTLR,但这将是一个比你想象的更重的解决方案。

于 2012-10-31T18:48:20.980 回答
0

一种简单的方法是搜索最后一个“{”,然后是紧随其后的“}”。然后验证中间的文本是否有效(应该是逗号分隔的列表)。然后用一个虚拟值替换整个字符串(从'{'到'}',例如0。然后重复直到你剩下0,否则你会遇到错误。

于 2012-10-31T19:01:15.667 回答