我正在阅读数百万行的多个文件,并且正在创建一个包含特定问题的所有行号的列表。例如,如果特定字段留空或包含无效值。
所以我的问题是什么是最有效的日期类型来跟踪可能超过一百万行的数字列表。使用字符串生成器、列表或其他东西会更有效吗?
我的最终目标是发出一条消息,例如“特定字段在 1-32、40、45、47、49-51 等处为空白。因此,对于字符串生成器,我将检查先前的值,如果它is 只是多了 1 我会将其从 1 更改为 1-2 如果超过一个将用逗号分隔它使用列表,我只需将每个数字添加到列表中,然后在文件具有已完全阅读。但是在这种情况下,我可以有多个包含数百万个数字的列表。
这是我使用 String Builder 组合数字列表的当前代码:
string currentLine = sbCurrentLineNumbers.ToString();
string currentLineSub;
StringBuilder subCurrentLine = new StringBuilder();
StringBuilder subCurrentLineSub = new StringBuilder();
int indexLastSpace = currentLine.LastIndexOf(' ');
int indexLastDash = currentLine.LastIndexOf('-');
int currentStringInt = 0;
if (sbCurrentLineNumbers.Length == 0)
{
sbCurrentLineNumbers.Append(lineCount);
}
else if (indexLastSpace == -1 && indexLastDash == -1)
{
currentStringInt = Convert.ToInt32(currentLine);
if (currentStringInt == lineCount - 1)
sbCurrentLineNumbers.Append("-" + lineCount);
else
{
sbCurrentLineNumbers.Append(", " + lineCount);
commaCounter++;
}
}
else if (indexLastSpace > indexLastDash)
{
currentLineSub = currentLine.Substring(indexLastSpace);
currentStringInt = Convert.ToInt32(currentLineSub);
if (currentStringInt == lineCount - 1)
sbCurrentLineNumbers.Append("-" + lineCount);
else
{
sbCurrentLineNumbers.Append(", " + lineCount);
commaCounter++;
}
}
else if (indexLastSpace < indexLastDash)
{
currentLineSub = currentLine.Substring(indexLastDash + 1);
currentStringInt = Convert.ToInt32(currentLineSub);
string charOld = currentLineSub;
string charNew = lineCount.ToString();
if (currentStringInt == lineCount - 1)
sbCurrentLineNumbers.Replace(charOld, charNew);
else
{
sbCurrentLineNumbers.Append(", " + lineCount);
commaCounter++;
}
}