嗨完整的新手问题:我有一个由两列组成的表。第一列属于“箱”,由果蝇居住的地方编码。第二列是 0 或 1,分别是中性和真正像糖。我有两个问题?
1)如果我怀疑只有一个变量,那就是他们居住的地方决定了他们是否喜欢糖。有没有办法让我的计算机只分成 2 个集群?所有喜欢糖和中性的垃圾箱。这样我们就可以做进一步的实验来确定这些垃圾箱是什么。
2) 自动确定可能有多少集群驱动了这种行为?例如,可能有 4 个变量(4 个集群)可以确定糖偏好的结果。
如果这是微不足道的,请道歉。下表列出。谢谢!
Bin sugar
1 1
1 1
1 0
1 0
2 1
2 0
2 0
3 1
3 0
3 1
3 1
4 1
4 1
4 1
5 1
5 0
5 1
6 0
6 0
6 0
7 0
7 1
7 1
8 1
8 0
8 1
9 1
9 0
9 0
9 0
10 0
10 0
10 0
11 1
11 1
11 1
12 0
12 0
12 0
12 0
13 0
13 0
13 1
13 0
13 0
14 0
14 0
14 0
14 0
15 1
15 0
15 0
16 1
16 1
17 1
17 1
18 0
18 1
18 1
17 1
19 1
20 1
20 0
20 0
20 1
21 0
21 0
21 1
21 0
22 1
22 0
22 1
22 1
23 1
23 1
24 1
24 0
25 0
25 1
25 0
26 1
26 1
27 1
27 1