4

我需要从没有标题名称的数据集中提取列。

我有一个 ~10000 x 3 数据集,我需要将第一列与后两列进行对比。

当列有名称时,我知道该怎么做〜plot(data$V1, data$V2)但在这种情况下它们没有。当每列没有名称时,如何单独访问它们?

谢谢

4

2 回答 2

6

我通常根据它们在矩阵/数据框中的位置来选择列。

例如

dataset[,4]选择第 4 列。

括号中的第一个数字表示行,第二个表示列。在这里,我没有使用“第一个数字”,因此选择了第 4 列的所有行,即整列。

这很容易记住,因为它源于矩阵计算。例如,一个 4x3 维矩阵有 4 行和 3 列。因此,当我想选择第三列的第一行时,我可以做类似的事情matrix[1,3]

于 2013-06-03T03:54:12.137 回答
6

为什么不给他们起合理的名字呢?

names(data)=c("This","That","Other")
plot(data$This,data$That)

这是比使用列号更好的解决方案,因为名称是有意义的,并且如果您的数据更改为具有不同数量的列,您的代码可能会在多个地方中断。为您的数据提供正确的名称,只要您始终引用,data$This您的代码就可以工作。

于 2013-06-03T07:45:28.297 回答