5

预先编写代码以可视化我面临的问题:

  1. 这是需要拆分的文本。
:20:0444453880181732
:21:0444453880131350
:22:CANCEL/ABCDEF0131835055
:23:BUY/CALL/E/EUR
:82A:ABCDEFZZ80A
:87A:4444655604
:30:061123
:31G:070416/1000/USNY
:31E:070418
:26F:PRINCIPAL
:32B:EUR1000000,00
:36:1,31000000
:33B:USD1310000,00
:37K:PCT1,60000000
:34P:061127USD16000,00
:57A:ABCDEFZZ80A

这是我的正则表达式

 Regex r = new Regex(@"\:\d{2}\w*\:", RegexOptions.Multiline);

 MatchCollection matches = r.Matches(Content);
 string[] items = r.Split(Content);

 // ----- Fix for first entry being empty string.
 int index = items[0] == string.Empty ? 1 : 0;

 foreach (Match match in matches)
 {
    MessageField field = new MessageField();

    field.FieldIdExtended = match.Value;
    field.Content = items[index];

    Fields.Add(field);

    index++;
 }

正如您从评论中看到的那样,字符串拆分会出现问题。它作为第一项返回一个空字符串。有什么优雅的方法可以解决这个问题吗?

谢谢,迪米

4

2 回答 2

4

你得到这种行为的原因是你的第一个分隔符之前没有任何东西,第一个条目是空白的。

正确解决此问题的方法可能是在正则表达式中捕获您想要的值,然后从匹配集中获取它。

粗略的第一次猜测你可能想要这样的东西:

Regex r = new Regex(@"^:(?<id>\d{2}\w*):(?<content>.*)$", RegexOptions.Multiline);

MatchCollection matches = r.Matches(Content);

foreach (Match match in matches)
{
    MessageField field = new MessageField();

    field.FieldIdExtended = match.Groups["id"].ToString()
    field.Content = match.Groups["content"].ToString();

    Fields.Add(field);

}

使用命名捕获组可以轻松提取内容。您可能需要根据需要调整正则表达式。目前它20作为 id 和0444453880181732content 获取。我不是 100% 清楚您需要捕获什么,但您使用正则表达式看起来不错,所以我认为这不是问题。:)

从本质上讲,您并不是真的要拆分内容,而是匹配内容并将其拉出。

于 2012-08-23T14:15:12.920 回答
-3

利用:

string[] items = r.Split(Content, StringSplitOptions.RemoveEmptyEntries);

删除空条目。

于 2012-08-23T14:04:09.207 回答