2

我有两个哈希集从两个不同的文本文件加载数据。两个文本文件的内容如下所示:

name/12441431252132
name1/323244231244142
name2/32423452524234

我的代码当前加载这两个文件并确保我只有来自 textFile2 的唯一结果:

HashSet<string> txt1 = new HashSet<string>(File.ReadLines("textFile1.txt"));
HashSet<string> txt2 = new HashSet<string>(File.ReadLines("textFile2.txt"));

txt2.ExceptWith(txt1); 

我的问题是,如果整行匹配,它只会根据标准删除行。我想根据名称删除它。例如,如果 name2 在 textFile1 中,则永远不应包含它,即使 / 之后的 id 不同。

我将如何做到这一点?

如果我的解释不好,请告诉我,我会努力改进它 - 请原谅我的英语!

4

3 回答 3

3

您可以添加一些字符串拆分来分隔名称和其余内容 - 该方法有点“肮脏”,因此在实际代码中我可能会使用 foreach 循环并引入专用类:

var content = File.ReadLines("textFile1.txt").Select(line => 
{
    var parts = line.Split('/');
    return new 
    { 
        Name = parts[0],
        Content = parts[1]
    };
});

HashSet<string> names = new HashSet<string>(content.Select(c=> c.Name));
HashSet<string> txt2 = new HashSet<string>(File.ReadLines("textFile2.txt"));
var uniques = txt2.Where(line => !names.Contains(line.Split('/')[0]));
于 2012-05-22T15:15:43.767 回答
0

如果按 拆分/,则可以构建一个包含出现在第一个集合中的名称的 HashSet,然后选择第二个集合中名称未出现在第一个集合中的项目。

var nameValues1=
    File
     .ReadLines(fileName)
     .Select(line=>line.Split('/'))
     .Select(parts=>new {name=parts[0],value=parts[1]});
var nameValues2=
    File
     .ReadLines(fileName2)
     .Select(line=>line.Split('/'))
     .Select(parts=>new {name=parts[0],value=parts[1]});
var names1=new HashSet<string>(nameValues1.Select(nv=>nv.name);
var result=
    nameValues2
     .Where(nv=>!names1.Contains(nv.name))
     .Select(nv=>string.Format("{0}/{1}",nv.name,nv.value);
于 2012-05-22T15:20:10.503 回答
0

您确定 aHashSet仍然是最佳选择吗?这是使用 a 的不同方法Dictionary<String, String>

var lines1 = System.IO.File.ReadLines(path1);
var lines2 = System.IO.File.ReadLines(path2);
var allItems = new Dictionary<String, String>();
foreach (var line in lines1.Concat(lines2))
{
    String[] tokens = line.Split('/');
    if (tokens.Length == 2)
    {
        String name = tokens[0];
        String number = tokens[1];
        if (!allItems.ContainsKey(name))
            allItems.Add(name, number);
    }
}
于 2012-05-22T15:30:01.973 回答