1

我写了一个正则表达式来解析格式的字符串

OBJECT_NAME KEY1=值 KEY2=值

(实际上由 2 个正则表达式完成)

这是我的实用程序类:

package de.hs.settlers.util;

import java.util.HashMap;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class ParseUtils {
    public static final Pattern OBJECT_NAME_PATTERN = 
            Pattern.compile("^([A-Z0-9 ]+) ([A-Z]+=.+)$");
    public static final Pattern KEY_VALUE_PATTERN = 
            Pattern.compile("^([A-Z0-9]+)=([^=]+)( [A-Z]+=.+)?$");

    public static ParseResult parseKeyValueLine(String line) {
        Matcher object = OBJECT_NAME_PATTERN.matcher(line.trim());
        String objectName = object.group(1);
        HashMap<String, String> data = new HashMap<String, String>();

        String vals = object.group(2);
        do {
            Matcher matcher = KEY_VALUE_PATTERN.matcher(vals);

            if (!matcher.matches()) {
                break;
            }

            String key = matcher.group(1);
            String value = matcher.group(2);
            data.put(key, value);
            vals = matcher.group(3);
            if (vals != null) {
                vals = vals.trim();
            }
        } while (vals != null);

        return new ParseResult(objectName, data);
    }

    public static class ParseResult {
        private String objectName;
        private HashMap<String, String> data;

        public ParseResult(String objectName, HashMap<String, String> data) {
            super();
            this.objectName = objectName;
            this.data = data;
        }

        public String getObjectName() {
            return objectName;
        }

        public HashMap<String, String> getData() {
            return data;
        }

        public String get(String key) {
            return getData().get(key);
        }
    }
}

我编写了一个测试,以“USER TEAM=Team A USER=tuxitux OTHER=bla”作为行参数来测试方法 parseKeyValueLine,但是执行失败,因为第一个表达式(OBJECT_NAME_PATTERN 中的那个)显然不匹配。

我遇到的问题是,当我将表达式和字符串粘贴到正则表达式调试器中时,它们都告诉我它匹配并给我正确的组。(用http://gskinner.com/RegExr/http://www.debuggex.com/测试)。

java做正则表达式有什么问题吗?

4

2 回答 2

6

问题在这里:

Matcher object = OBJECT_NAME_PATTERN.matcher(line.trim());
String objectName = object.group(1);

您创建了匹配器,但您没有告诉它实际对字符串进行处理。结果,即使有比赛,您也没有可用的组。

您需要调用其中一种匹配方法(.find(),.lookingAt().matches(),但所有这三种方法对您来说都是等效的,因为您的正则表达式都锚定在输入的开头和结尾),然后收集组。

示例 ( .find()):

Matcher object = OBJECT_NAME_PATTERN.matcher(line.trim());
object.find(); // or you could have an if statement here
String objectName = object.group(1);
于 2013-06-13T12:06:50.137 回答
0

确保您没有任何监视表达式。对我来说,是 IDE watch 表达式导致了这个问题。

于 2018-12-21T13:51:56.147 回答