我的文件是:
outlook temperature Humidity Windy PlayTennis
sunny hot high false N
sunny hot high true N
overcast hot high false P
rain mild high false P
rain cool normal false P
我从文件中发现了独特的元素:
element:occurence
suny :2
overcast:1
rain:2
mild:1
cool:1
hot :4
normal:1
high:2
false:4
true:1
n:2
p:3
然后我删除了出现次数小于 1 的元素。
输出如下:
suny : 2
rain: 2
hot :3
high:4
false:4
n:2
p:3
现在我想要输出为(从第一个输出开始,它应该与所有其他元素循环以形成一组两个频繁集)
element:occurence
sunny,hot:2
sunny,high:2
sunny,false:1
sunny,n:2
sunny,p:0
rain,hot:0
rain,high:1
rain,false:2
rain,n:0
rain,p:2
hot,high:2
hot,false:1
hot,n:2
hot,p:0
and so on..
这是我的代码:
var occurences = File.ReadAllLines(file)
.Skip(1)
.SelectMany(l => l.Split(new []{' '},StringSplitOptions.RemoveEmptyEntries))
.GroupBy(w => w)
.ToDictionary(g => g.Key, g => g.Count());
foreach(var pair in occurences)
label1.Text += String.Format("{0}: {1}\n", pair.Key, pair.Value);
我实现了这个来找到第一个频繁集。
对于第二个我该怎么办?
我还需要找到第三组。