36

在最近开发包的努力中,我将数据集包含在data/我的包的文件夹中。在我的具体情况下,我有 5 个数据集,所有这些数据集都是data.table格式的(尽管如果我将它们保留为,我在下面描述的问题仍然存在data.frame)。我已将每个文件保存为单独的.rda文件并适当地记录它们。

当我check()从 package运行时devtools,我收到以下警告:

 checking data for ASCII and uncompressed saves ... WARNING
  Warning: large data file(s) saved inefficiently:
          size ASCII compress
  data1.rda 129Kb  TRUE     gzip
  data2.rda 101Kb  TRUE     gzip
  data3.rda 1.6Mb  TRUE     gzip

  Note: significantly better compression could be obtained
        by using R CMD build --resave-data
              old_size new_size compress
  data1.rda         129Kb     34Kb       xz
  data2.rda         101Kb     20Kb       xz
  data4.rda          92Kb     35Kb       xz
  data3.rda         1.6Mb    116Kb       xz
  species.rda     12Kb      9Kb       xz

我尝试使用resaveRdaFiles(package tools) 以推荐的xz压缩方式保存数据。即使在这样做之后,警告仍然存在。

好的,所以我运行R CMD build --resave-data并且警告继续存在。

我在这里缺少什么以及如何克服这个问题(现在和将来)?

4

1 回答 1

33

保存.rda文件时,请使用命令:save(..., file='test.rda', compress='xz') 这将有助于解决问题!

于 2012-05-21T01:48:34.210 回答