我正在尝试在java中使用String split,将整个文档拆分为制表符空格和换行符之间的子字符串,但我想排除引号之间存在单词的情况。
例子:
这个文件
CATEGORYTYPE1
{
CATEGORYSUBTYPE1
{
OPTION1 “ABcd efg1234”
OPTION2 ABCdefg12345
OPTION3 15
}
CATEGORYSUBTYPE2
{
OPTION1 “Blah Blah 123”
OPTION2 Blah
OPTION3 10
OPTION4 "Blah"
}
}
拆分为这些子字符串(如 Eclipse 调试器中所示):
[CATEGORYTYPE1, {, CATEGORYTYPE1, {, OPTION1, “ABcd, efg1234”, OPTION2....
当我使用我当前的正则表达式时:
String regex = "([\\n\\r\\s\\t]+)";
String[] tokens = data.split(regex);
但我想要实现的是像这样拆分它:
[CATEGORYTYPE1, {, CATEGORYTYPE1, {, OPTION1, “ABcd efg1234”, OPTION2....
(不拆分引号之间的内容)
这可能与正则表达式有关吗?怎么做?