2

有人可以解释为什么在下面的示例中,即使它被明确命名并且可以这样调用但对于该列而言,列名why似乎仍然存在?xwhyzz

df<-data.frame(x=1:5,y=1:5)
df$z<-"a"
df$zz<-df$x*df$y
df$why<-df[1]*df[2]

df

df["why"]
4

2 回答 2

6

因为您实际上是将数据框存储到为什么 - 而不是向量中。

> str(df)
'data.frame':   5 obs. of  4 variables:
 $ x  : int  1 2 3 4 5
 $ y  : int  1 2 3 4 5
 $ z  : chr  "a" "a" "a" "a" ...
 $ why:'data.frame':    5 obs. of  1 variable:
  ..$ x: int  1 4 9 16 25
> str(df[1]*df[2])
'data.frame':   5 obs. of  1 variable:
 $ x: int  1 4 9 16 25
> str(df[,1] * df[,2])
 int [1:5] 1 4 9 16 25  
> df$why2 <- df[,1]*df[,2]
> df
  x y z  x why2
1 1 1 a  1    1
2 2 2 a  4    4
3 3 3 a  9    9
4 4 4 a 16   16
5 5 5 a 25   25

df[1]返回 df 的第一个元素作为子列表。数据框是一种特殊类型的列表,这就是为什么您可以使用这种类型的索引来抓取列的原因。但是,仅使用单括号告诉它返回包含感兴趣元素的子列表(而不仅仅是感兴趣的元素)。

于 2012-09-18T13:20:03.170 回答
1

可能是您的问题是索引,试试这个:

df$zz<-df$x*df$y       # this should replace df$zz<-x*y
df$why<-df[,1]*df[,2]  # this repaces df$why<-df[1]*df[2]

df
  x y z zz why
1 1 1 a  1   1
2 2 2 a  4   4
3 3 3 a  9   9
4 4 4 a 16  16
5 5 5 a 25  25

df["why"]
  why
1   1
2   4
3   9
4  16
5  25
于 2012-09-18T13:16:09.247 回答