0

在这个例子中使用 iris 数据集,因为很多人都知道。

我缩放了数据集的前 4 个变量,并将其命名为 scaled.iris。 为什么我现在按索引或按变量名 standardized.iris <- scale(iris[,-5]) cbind 列有区别 ?cbind(scaled.iris,iris[5])cbind(scaled.iris,iris$Species)

前者给了我一个data.frame,其中有一列带有实际标签(“setosa”,“versicolor”,...)加上正确的列名,后者给了我一个没有列名加上字符值1-3的矩阵.

4

1 回答 1

1

这是因为被调用的对象的类。它与 . 无关cbind()

当使用列号从数据框中选择一列时,所选列将被提取为数据框。如果调用单个列,则提取的对象将是具有一列的数据框。如果调用多于一列,则提取的对象将是具有与调用一样多的列的数据框。

当使用列名选择列时,所选列将被提取为没有名称的向量。如果调用单个列,则提取的对象将是单个向量。如果调用了多于一列,则提取的对象将是一个与调用的向量一样多的向量。

如果你运行str(),你会发现不同之处。

> str(iris[1])
'data.frame':   150 obs. of  1 variable:
 $ Sepal.Length: num  5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ...

> str(iris$Sepal.Length)
 num [1:150] 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ...

你可以看到前者的类是由数字向量组成的data.frame,而后者的类是数字的。

于 2020-05-14T09:39:54.727 回答