我需要从没有标题名称的数据集中提取列。
我有一个 ~10000 x 3 数据集,我需要将第一列与后两列进行对比。
当列有名称时,我知道该怎么做〜plot(data$V1, data$V2)
但在这种情况下它们没有。当每列没有名称时,如何单独访问它们?
谢谢
我需要从没有标题名称的数据集中提取列。
我有一个 ~10000 x 3 数据集,我需要将第一列与后两列进行对比。
当列有名称时,我知道该怎么做〜plot(data$V1, data$V2)
但在这种情况下它们没有。当每列没有名称时,如何单独访问它们?
谢谢
我通常根据它们在矩阵/数据框中的位置来选择列。
例如
dataset[,4]
选择第 4 列。
括号中的第一个数字表示行,第二个表示列。在这里,我没有使用“第一个数字”,因此选择了第 4 列的所有行,即整列。
这很容易记住,因为它源于矩阵计算。例如,一个 4x3 维矩阵有 4 行和 3 列。因此,当我想选择第三列的第一行时,我可以做类似的事情matrix[1,3]
为什么不给他们起合理的名字呢?
names(data)=c("This","That","Other")
plot(data$This,data$That)
这是比使用列号更好的解决方案,因为名称是有意义的,并且如果您的数据更改为具有不同数量的列,您的代码可能会在多个地方中断。为您的数据提供正确的名称,只要您始终引用,data$This
您的代码就可以工作。