我有像流动一样的大数据集,我想对此进行简单的搜索:
>mydata
ID TF
hsa-let-7a-1 SRF
hsa-let-7a-1 PPARG
hsa-let-7a-2 AREB6
hsa-let-7a-3 1-Oct
hsa-let-7a-3 SRF
hsa-let-7a-3 PPARG
hsa-let-7b SRF
. .
. .
. .
问题:对于给定的y<- c("hsa-let-7a-3","hsa-let-7a-1","hsa-let-7b"...)
,找到y
其中具有相同 TF 的元素mydata
。的某些元素y
可能不在 中ID
,因此应检查 y 中在ID
! 中的那些元素。
最后像集群或组一样打印它们,其中每个组/集群 ID 具有相同TF
的 . 问题是,在 mydata 中有相同的 ID,但TF
. 有人可以帮我在 R. 中实现这个吗?我期望的关于示例的输出是(输出中的所有 ID 都在y
,但并非所有元素y
都在ID
!):
ID TF
>group1 hsa-let-7a-1 SRF
hsa-let-7a-3 SRF
hsa-let-7b SRF
>group2 hsa-let-7a-1 PPARG
hsa-let-7a-3 PPARG