3

在下面,假设我试图33333-从结果中排除邮政编码。
我愿意:

String zip = "11111 22222 33333- 44444-4444";
String regex = "\\d{5}(?(?=-)-\\d{4})";
Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(zip);
while (matcher.find()) { 
   System.out.println(" Found: " + matcher.group());     
}

期望获得:

Found:  11111  
Found:  22222  
Found:  44444-4444

我正在尝试强制执行以下格式:
5 位数字可选地后跟 - 和 4 位数字。不需要只有 - (连字符)的 5 位数字

我得到例外:

Exception in thread "main" java.util.regex.PatternSyntaxException: Unknown inline modifier near index 7
\d{5}(?(?=-)(-\d{4}))
       ^
    at java.util.regex.Pattern.error(Unknown Source)
    at java.util.regex.Pattern.group0(Unknown Source)
    at java.util.regex.Pattern.sequence(Unknown Source)
    at java.util.regex.Pattern.expr(Unknown Source)
    at java.util.regex.Pattern.compile(Unknown Source)
    at java.util.regex.Pattern.<init>(Unknown Source)
    at java.util.regex.Pattern.compile(Unknown Source)

我没有正确使用条件前瞻吗?

4

4 回答 4

6

要捕获除 33333 之外的所有数字,请使用以下代码:

String zip = "11111 22222 33333- 44444-4444";
String regex = "\\d{5}(?=(-\\d{4}|\\s|$))(-\\d{4})?";
Matcher m = Pattern.compile(regex).matcher(zip);
while(m.find())
    System.out.printf("Macthed: [%s]%n", m.group(1));

输出:

Macthed: [11111]
Macthed: [22222]
Macthed: [44444-4444]

说明:这个正则表达式使用了前瞻,它本身就像一个条件,这意味着匹配 5 位数字,必须后跟 - 和 4 位数字或空格或字符串结尾,然后它可以选择匹配文本 - 和 4 位数字。

您的原始 RegEx 引发异常的原因是?:(?=-)您的 RegEx 的一部分存在语法错误。

于 2012-01-20T18:22:31.423 回答
0

您在 之后缺少一个冒号(?,即使用此正则表达式(非 Java 字符串):\d{5}(?:(?=-)-\d{4})

但是,这可能仍然不会产生您想要的结果。请发布一些示例输入和所需的输出。

于 2012-01-20T17:43:45.520 回答
0

你的问题对我来说有点不清楚。我想你正在寻找:

String st = "11111 22222 33333- 44444-4444";
String pattern = "\\d+(- )";
String res  = st.replaceAll(pattern,"");
System.out.println(res);

输出 =11111 22222 44444-4444

于 2012-01-20T17:56:49.217 回答
0
(\d{5}(?!-\s)(?:-\d{4})?)

因此:

String regex = "(\\d{5}(?!-\\s)(?:-\\d{4})?)";`
于 2012-01-21T03:22:16.723 回答