这是对这个 SO question的扩展。与原始问题相比,此问题考虑了两个不同的封闭字符。
我想用任意数字的(空白)空格分割,但忽略<>和“”之间的所有内容。所以这个字符串:
string Line = "1 2 <1 2> \"hello world\" 3";
应该导致:
1, 2, <1 2>, “你好世界”, 3
这是对这个 SO question的扩展。与原始问题相比,此问题考虑了两个不同的封闭字符。
我想用任意数字的(空白)空格分割,但忽略<>和“”之间的所有内容。所以这个字符串:
string Line = "1 2 <1 2> \"hello world\" 3";
应该导致:
1, 2, <1 2>, “你好世界”, 3
而不是Split
,我将使用Matches
string Line = "1 2 <1 2> \"hello world\" 3";
var parts = Regex.Matches(Line, @"[<\""]{1}[\w \d]+?[>\""]{1}|[\w\d]+")
.Cast<Match>()
.Select(m=>m.Value)
.ToArray();
PS:这也将匹配"abc def>
. 但我忽略了它以使正则表达式更短
到目前为止,这是我想出的:
public static string[] GetSplitStrings(string input)
{
IList<string> splitStrings = new List<string>();
var counter = 0;
var sb = new StringBuilder();
var inLessGreater = false; // sometimes <> can contain "
foreach (var character in input)
{
if (character.Equals('<'))
{
inLessGreater = true;
counter++;
}
if (character.Equals('>'))
{
inLessGreater = false;
counter++;
}
if (character.Equals('"') && !inLessGreater)
{
counter++;
}
if ((character.Equals(' ') && counter == 0) || (counter == 2))
{
if (sb.ToString().Equals("") == false)
{
if (character.Equals('"') || character.Equals('>'))
{
sb.Append(character);
}
splitStrings.Add(sb.ToString());
}
sb.Clear();
counter = 0;
}
else
{
sb.Append(character);
}
}
return splitStrings.ToArray();
}
更喜欢简洁的正则表达式解决方案。