0

我需要使用 R 打开一个 excel 文件,该文件可以有 1000~10000 行和 5000~20000 列。我想知道R中这种excel文件的大小有什么限制吗?

4

3 回答 3

3

我在 R 方面没有看到任何障碍。看起来像一个大小适中的数据集。它可能取决于您“如何”执行此操作,但您没有描述任何代码,所以这仍然是一个未知数。

于 2012-08-07T01:49:15.133 回答
2

一般来说,您使用 R 的限制将是数据集在内存中的适合程度,而不是对数据集大小或维度的特定限制。您越接近填满可用 RAM(包括您在计算机上执行的所有其他操作),您遇到问题的可能性就越大。

但请记住,拥有足够的 RAM 来简单地将数据集加载到内存中通常与拥有足够的 RAM 来操作数据集是完全不同的事情,因为R 的本质通常会涉及大量的对象复制。这反过来又导致了一整套专门的 R 包,这些包允许以最少(或零)复制操作 R 中的数据......

鉴于您提供的信息量非常有限,关于您的具体情况,我最多只能说您的数据似乎不会超过您的物理 RAM 限制,但它会足够大,您需要采取一些注意编写智能代码,因为许多幼稚的方法最终可能会非常缓慢。

于 2012-08-07T04:35:40.740 回答
1

以上答案正确讨论了内存问题。我最近也导入了一些大型的 excel 文件。我强烈建议尝试使用该XLConnect软件包来读取(和写入)文件。

options(java.parameters = "-Xmx1024m") # Increase the available memory for JVM to 1GB or more.
                                       # This option should be always set before loading the XLConnect package.
library(XLConnect)

wb.read <- loadWorkbook("path.to.file")
data <- readWorksheet(wb.read, sheet = "sheet.name")
于 2012-08-07T22:05:09.627 回答