-1

我正在尝试比较一行数组的 0 索引中的值和下一行的 0 索引中的值。想象一个 CSV,其中我在第一列中有一个唯一标识符,在第二列中有一个对应的值。

USER1, 1P
USER1, 3G
USER2, 1P
USER3, 1V

我想检查 [0] 的值下一行(或上一行,如果这更容易)进行比较,如果它们相同(如示例中所示)将其连接到索引 1。也就是说,数据应该读取作为

USER1, 1P, 3G
USER2, 1P
USER3, 1V

在它被传递到下一个函数之前。到目前为止我有

 private void csvParse(string path)
        {
            using (TextFieldParser parser = new TextFieldParser(path))
                {
                    parser.Delimiters = new string[] { "," };
                    while (!parser.EndOfData)
                    {
                        string[] parts = parser.ReadFields();
                        if (parts == null)
                        {
                            break;
                        }
                        contact.ContactId = parts[0];
                        long nextLine;
                        nextLine = parser.LineNumber+1;
//if line1 parts[0] == line2 parts[0] etc.
                    }
                }
            }

有没有人有什么建议?谢谢你。

4

4 回答 4

1

如何将数组保存到变量中:

private void csvParse(string path)
        {
            using (TextFieldParser parser = new TextFieldParser(path))
                {
                    parser.Delimiters = new string[] { "," };
                    string[] oldParts = new string[] { string.Empty };
                    while (!parser.EndOfData)
                    {
                        string[] parts = parser.ReadFields();
                        if (parts == null || parts.Length < 1)
                        {
                            break;
                        }

                        if (oldParts[0] == parts[0])
                        {
                             // concat logic goes here
                        }
                        else
                        {
                            contact.ContactId = parts[0];
                        }

                        long nextLine;
                        nextLine = parser.LineNumber+1;
                        oldParts = parts;
//if line1 parts[0] == line2 parts[0] etc.
                    }
                }
            }
于 2016-03-31T20:25:39.637 回答
1

如果我理解正确,那么您要问的本质上是“如何根据第一列中的值对第二列中的值进行分组?”。

一种快速且非常简洁的方法是使用 LINQ进行分组:

var linesGroupedByUser =
    from line in File.ReadAllLines(path)
    let elements = line.Split(',')
    let user = new {Name = elements[0], Value = elements[1]}
    group  user by user.Name into users
    select users;

foreach (var user in linesGroupedByUser)
{
    string valuesAsString = String.Join(",", user.Select(x => x.Value));

    Console.WriteLine(user.Key + ", " + valuesAsString);
}

我没有使用您的TextFieldParser课程,但您可以轻松地使用它。但是,这种方法确实要求您有能力将所有数据加载到内存中。你没有提到这是否可行。

于 2016-03-31T20:39:23.203 回答
0

执行此类操作的最简单方法是将每一行转换为一个对象。您可以使用https://www.nuget.org/packages/CsvHelper/为您完成工作,或者您可以迭代每一行并解析为一个对象CsvHelper。这是一个很棒的工具,它知道如何正确地将 CSV 文件解析为对象集合。然后,无论您是自己创建集合还是使用,您都可以使用到,https://msdn.microsoft.com/en-us/library/bb534304 (v=vs.100).aspx ,您的“密钥”(在此案例用户 ID)和,https: //msdn.microsoft.com/en-us/library/bb549218(v=vs.110).aspxCsvHelperLinqGroupByAggregate,将其他属性转换为字符串。然后,您可以将新的、分组的集合用于您的最终目标(将其写入文件或将其用于您需要的任何内容)。

于 2016-03-31T20:29:09.587 回答
0

您基本上是在查找所有唯一条目,因此将它们放入以联系人 ID 作为键的字典中。如下:

 private void csvParse(string path)
    {
        using (TextFieldParser parser = new TextFieldParser(path))
        {
            parser.Delimiters = new string[] { "," };
            Dictionary<string, List<string>> uniqueContacts = new Dictionary<string, List<string>>();
            while (!parser.EndOfData)
            {
                string[] parts = parser.ReadFields();
                if (parts == null || parts.Count() != 2)
                {
                    break;
                }
                //if contact id not present in dictionary add
                if (!uniqueContacts.ContainsKey(parts[0]))
                    uniqueContacts.Add(parts[0],new List<string>());
                //now there's definitely an existing contact in dic (the one 
                //we've just added or a previously added one) so add to the                   
                //list of strings for that contact
                uniqueContacts[parts[0]].Add(parts[1]);
            }

            //now do something with that dictionary of unique user names and
            // lists of strings, for example dump them to console in the 
            //format you specify:

            foreach (var contactId in uniqueContacts.Keys)
            {

                var sb = new StringBuilder();
                sb.Append($"contactId, ");
                foreach (var bit in uniqueContacts[contactId])
                {
                    sb.Append(bit);
                    if (bit != uniqueContacts[contactId].Last())
                        sb.Append(", ");
                }
                Console.WriteLine(sb);
            }
        }
    }
于 2016-03-31T20:33:31.637 回答