0

下面是我的大数据文件的前几行:

Symbol|Security Name|Market Category|Test Issue|Financial Status|Round Lot Size
AAC|Australia Acquisition Corp. - Ordinary Shares|S|N|D|100
AACC|Asset Acceptance Capital Corp. - Common Stock|Q|N|N|100
AACOU|Australia Acquisition Corp. - Unit|S|N|N|100
AACOW|Australia Acquisition Corp. - Warrant|S|N|N|100
AAIT|iShares MSCI All Country Asia Information Technology Index Fund|G|N|N|100
AAME|Atlantic American Corporation - Common Stock|G|N|N|100

我在以下位置读取数据:

data <- read.table("nasdaqlisted.txt", sep="|", quote='', header=TRUE, as.is=TRUE)

并构造一个数组和一个矩阵:

d1 <- array(data, dim=c(nrow(data), ncol(data))) 
d2 <- matrix(data, nrow=nrow(data), ncol=ncol(data))

然而,即使d1是一个数组并且d2是一个矩阵,classmode是相同的:

> class(d1)
[1] "matrix"
> mode(d1)
[1] "list"
> class(d2)
[1] "matrix"
> mode(d2)
[1] "list"

为什么是这样?

4

1 回答 1

7

我会努力解释我对这些问题的理解。

您不需要大型测试文件来证明问题。一个简单的data.frame会做:

test <- data.frame(var1=1:2,var2=letters[1:2])

> test
  var1 var2
1    1    a
2    2    b

请记住,adata.frame只是list内部的。

> is.data.frame(test)
[1] TRUE
> is.list(test)
[1] TRUE

如您所料,具有类似list的结构。

> str(test)
'data.frame':   2 obs. of  2 variables:
 $ var1: int  1 2
 $ var2: Factor w/ 2 levels "a","b": 1 2

> str(as.list(test))
List of 2
 $ var1: int [1:2] 1 2
 $ var2: Factor w/ 2 levels "a","b": 1 2

当您指定对 a或 a的matrix调用时,您最终会得到一个填充了 data.frame 或列表元素的矩阵。data.framelist

result1 <- matrix(test)

> result1
     [,1]     
[1,] Integer,2
[2,] factor,2 

查看 的结构result1,您可以看到它仍然是list,但现在只有尺寸(请参见下面输出中的最后一行)。

> str(result1)
List of 2
 $ : int [1:2] 1 2
 $ : Factor w/ 2 levels "a","b": 1 2
 - attr(*, "dim")= int [1:2] 2 1

这意味着它现在既是 amatrix又是 alist

> is.matrix(result1)
[1] TRUE
> is.list(result1)
[1] TRUE

如果您从该对象中去除尺寸,它将不再是 amatrix并且将恢复为只是 a list

dim(result1) <- NULL

> result1
[[1]]
[1] 1 2

[[2]]
[1] a b
Levels: a b

> is.matrix(result1)
[1] FALSE
> is.list(result1)
[1] TRUE

> str(result1)
List of 2
 $ : int [1:2] 1 2
 $ : Factor w/ 2 levels "a","b": 1 2
于 2012-08-09T11:48:20.917 回答