我的 RDD 可能有具有恒定值的列。换言之,某些列的方差可能为零。我的目标是从 RDD 中删除所有这些列(并最终计算剩余列的协方差矩阵)。我怎样才能做到这一点?
谢谢并恭祝安康,
我的 RDD 可能有具有恒定值的列。换言之,某些列的方差可能为零。我的目标是从 RDD 中删除所有这些列(并最终计算剩余列的协方差矩阵)。我怎样才能做到这一点?
谢谢并恭祝安康,
RDD 应该是不可变的。因此,我认为您不想从中删除某些内容,而只是map
将其删除为适合您和/或某些内容的内容(文档filter
中的更多详细信息)。