我有缺失值的基因组数据,我想通过使用可用值来计算每对基因的表达水平之间的距离。然后我想发现 K 个最近的邻居来填补空白?我怎么能在 R 中做到这一点?
gene sample 1 sample 2 sample 3 sample 4
1 5555 NA 2151 5484
2 5564 NA NA NA
3 4544 4656 14546 45455
4 NA 54654 NA NA
...我如何计算欧几里德距离?我当时只需要使用一排吗?
抱歉,我是基因组数据的新手,我无法在任何地方找到此信息。
谢谢。