是否有一种策略可以在一个条件下对一个组内的共享属性进行聚类,知道该条件应该激发两个组之间的差异?
一个具体的例子:假设 A 组有 4 个人,B 组也有 4 个人。A 组被引入 StackOverflow,而其他人则一无所有。为每个人检查了 30 000 个基因。我们预计 A 组个体与 B 组相比应该相对无压力。因此,我们寻找可能在 B 组中高表达但在 A 组中低表达的基因簇。识别这组基因很有用,因为这些基因可以解释对压力的生物反应。
但事实证明,这两组不是线性可分的——PCA 在 A 组和 B 组中显示出很大的差异。A 组中的一些个体与 B 组聚集在一起。B 组中有一些基因被上调,但是A组中的一两个人也承受这种上调。是否有一种策略可以找到属性由 A 组中的所有个体统一共享的集群,并且与 B 组中的所有个体不同,知道这两个组应该是不同的。