1

我试图找到与每个 bugid 相关的不同文件名列表,并且我使用 linq 对与每个 bug id 相关的所有文件名进行分组。我不知道如何删除与每个 bugid 相关的重复文件名,在文件输出中我有多个这样的行: bugid filename1 filename2 filename3 filename4 ......相同的 bugid 并且每个 bug id 都有重复的文件名,这是我的代码:

using System;
using System.Collections.Generic;
using System.Text;
using System.Linq;


namespace finalgroupquery
{
    class MainClass
{
        public static void Main (string[] args)
        {

            List <bug> list2=new List <bug> ();
             using(System.IO.StreamReader reader1= new System.IO.StreamReader( @"/home/output"))
                using (System.IO.StreamWriter file = new System.IO.StreamWriter( @"/home/output1")) 
                        {string line1;
                         while ((line1=reader1.ReadLine())!=null) 
                            { string[] items1=line1.Split('\t');        
                                    bug bg=new bug();
                                      bg.bugid=items1[0];
                                for (int i=1; i<=items1.Length -1;i++)
                                    { bg.list1.Add(items1[i]);}
                                            list2.Add(bg);
                            }

                            var bugquery= from c in list2 group c by c.bugid into x select
                                            new Container { BugID = x.Key, Grouped = x };



                            foreach (Container con in bugquery)
                            {
                                StringBuilder files = new StringBuilder();
                                files.Append(con.BugID);
                                files.Append("\t");

                                foreach(var x in con.Grouped)
                                {
                                    files.Append(string.Join("\t", x.list1.ToArray()));
                                }

                                file.WriteLine(files.ToString());       }


            }
        }
    }

    public class Container
    {
        public string BugID {get;set;}
        public IGrouping<string, bug> Grouped {get;set;}
    }

    public class bug
    { 
        public List<string> list1{get; set;}
        public string bugid{get; set;}

        public bug()
        {
            list1=new List<string>();
        }       


    }
}


}
4

2 回答 2

1

尝试使用此代码:

        var bugquery = from c in list2
                        group c by c.bugid into x
                        select new bug { bugid = x.Key, list1 = x.SelectMany(l => l.list1).Distinct().ToList() };

        foreach (bug bug in bugquery)
        {
            StringBuilder files = new StringBuilder();
            files.Append(bug.bugid);
            files.Append("\t");
            files.Append(string.Join("\t", bug.list1.ToArray()));

            file.WriteLine(files.ToString());
        }

由于SelectManyDistinctLinq 运算符的组合,您可以展平文件名列表并在一行中删除重复项。

SelectMany(来自msdn):

将序列的每个元素投影到 IEnumerable 并将生成的序列展平为一个序列。

不同(来自msdn):

从序列中返回不同的元素。

这也意味着不再需要您的Container类,因为不再需要遍历 IGrouping<string, bug>集合(这里list1包含所有与错误相关的文件名,没有重复)。

编辑

由于您在读取和解析文件后可能有一些空行和/或空字符串,您可以使用此代码来摆脱它们:

        using (System.IO.StreamReader reader1 = new System.IO.StreamReader(@"/home/sunshine40270/mine/projects/interaction2/fasil-data/common history/outputpure"))
        {
            string line1;
            while ((line1 = reader1.ReadLine()) != null)
            {
                if (!string.IsNullOrWhiteSpace(line1))
                {
                    string[] items1 = line1.Split(new [] { '\t' }, StringSplitOptions.RemoveEmptyEntries);
                    bug bg = new bug();
                    bg.bugid = items1[0];
                    for (int i = 1; i <= items1.Length - 1; i++)
                    {
                        bg.list1.Add(items1[i]);
                    }
                    list2.Add(bg);
                }
            }
        }

你会注意到:

  • 一旦从您的流中检索到存储的新行(使用)line1,就会检查它们是否为空!string.IsNullOrWhiteSpace(line1)
  • 要从string.Split方法的返回值中省略空子字符串,可以使用StringSplitOptions.RemoveEmptyEntries参数。

希望这可以帮助。

于 2013-10-28T23:57:57.530 回答
1

从您的描述看来,您想这样做:

        List <bug> bugs = new List<bug>();
        var lines = System.IO.File.ReadLines(@"/home/bugs");
        foreach (var line in lines) {
            string[] items = line.Split('\t');
            bug bg=new bug();
            bg.bugid = items[0];
            bg.list1 = items.Skip(1).OrderBy(f => f).Distinct().ToList();
            bugs.Add(bg);
            }

这将产生一个对象列表,其中每个对象都有一个唯一的文件名列表。

于 2013-10-29T00:02:51.173 回答