1

我有以下类型的字符串:

asdf:0123-456-789:USB0::0x1234::0x9ABC::0123-456-789::INSTR

首先是名称asdf后跟序列号0123-456-789,然后是地址字符串USB0::0x1234::0x9ABC::0123-456-789::INSTR。格式是

name:serial:addr

我想将名称、序列号和地址提取到单个 Strings中。地址也可以包含::所以我不能只是String#split(String regex)它(或者我可以吗?)。我的想法是使用捕获这三个实体的正则表达式。我对正则表达式很陌生。

我正在使用 Java:

String input = "asdf:0123-456-789:USB0::0x1234::0x9ABC::0123-456-789::INSTR";
// name
Matcher nameMatcher = Pattern.compile("[0-9a-zA-Z]+").matcher(input);
nameMatcher.find();
String name = nameMatcher.group();
// serial
Matcher serialMatcher = Pattern.compile("[0-9]{3}-[0-9]{9}-[0-9]{4}").matcher(input);
serialMatcher.find();
String serial = serialMatcher.group();
// address
Matcher addrMatcher = Pattern.compile("[0-9a-zA-Z[:]{2}-]+").matcher(input);
addrMatcher.find();
String address= addrMatcher.group();
System.out.println(name + " / " + serial + " / " + address);

// result:
// asdf, 012-012345678-0123, asdf:012-012345678-01234:USB0::0x1234::0x9ABC::012-012345678-01234::INSTR

这适用于名称和序列号,但不适用于地址(它捕获整个输入字符串而不仅仅是地址)。问题是我只想允许::而不是:,但它不能按我的预期工作。有没有很好的方法来匹配这个或者这太复杂了?如果是这样,你能告诉我不同​​的方法吗?

编辑:我刚刚为我找到了一个足够好的解决方案:

String input = "asdf:012-012345678-01234:USB0::0x1234::0x9ABC::012-012345678-01234::INSTR";
String[] asdf = input.split(":");
String name = asdf[0];
String serial = asdf[1];
String address = asdf[2];
for (int i = 3; i < asdf.length; i++)
  address += ":" + asdf[i];
Log.i(name + ", " + serial + ", " + address);

但是问题仍然存在(出于好奇和学习)。

4

3 回答 3

2
String info="asdf:0123-456-789:USB0::0x1234::0x9ABC::0123-456-789::INSTR";
String[] array=info.split(":", 3);//split only in 3 parts

System.out.println("name="+array[0]);
System.out.println("serial="+array[1]);
System.out.println("addr="+array[2]);

输出

name = asdf
serial = 0123-456-789
addr = USB0::0x1234::0x9ABC::0123-456-789::INSTR
于 2012-07-10T12:51:01.890 回答
2

你可以做类似的事情

input.split("(?<!:):(?!:)")

它基本上环顾 : 字符以确保它旁边没有其他 : 字符。

于 2012-07-10T13:04:48.810 回答
1

您可以将地址本身与正则表达式匹配([\w-])+(::([\w-]+))+

([\w-])+    one or more word (alphanumeric) or hyphen characters ...
(           ... followed by ...
::          ... two colons ...
([\w-]+)    ... with one or more word (alphanumeric) or hyphen characters ...
)+          ... at least one more time
于 2012-07-10T13:05:52.890 回答