有人可以解释为什么在下面的示例中,即使它被明确命名并且可以这样调用但对于该列而言,列名why
似乎仍然存在?x
why
zz
df<-data.frame(x=1:5,y=1:5)
df$z<-"a"
df$zz<-df$x*df$y
df$why<-df[1]*df[2]
df
df["why"]
因为您实际上是将数据框存储到为什么 - 而不是向量中。
> str(df)
'data.frame': 5 obs. of 4 variables:
$ x : int 1 2 3 4 5
$ y : int 1 2 3 4 5
$ z : chr "a" "a" "a" "a" ...
$ why:'data.frame': 5 obs. of 1 variable:
..$ x: int 1 4 9 16 25
> str(df[1]*df[2])
'data.frame': 5 obs. of 1 variable:
$ x: int 1 4 9 16 25
> str(df[,1] * df[,2])
int [1:5] 1 4 9 16 25
> df$why2 <- df[,1]*df[,2]
> df
x y z x why2
1 1 1 a 1 1
2 2 2 a 4 4
3 3 3 a 9 9
4 4 4 a 16 16
5 5 5 a 25 25
df[1]
返回 df 的第一个元素作为子列表。数据框是一种特殊类型的列表,这就是为什么您可以使用这种类型的索引来抓取列的原因。但是,仅使用单括号告诉它返回包含感兴趣元素的子列表(而不仅仅是感兴趣的元素)。
可能是您的问题是索引,试试这个:
df$zz<-df$x*df$y # this should replace df$zz<-x*y
df$why<-df[,1]*df[,2] # this repaces df$why<-df[1]*df[2]
df
x y z zz why
1 1 1 a 1 1
2 2 2 a 4 4
3 3 3 a 9 9
4 4 4 a 16 16
5 5 5 a 25 25
df["why"]
why
1 1
2 4
3 9
4 16
5 25