5

我渴望将两个 460 x 5000 数字矩阵保存到我的 R 包中。按照以下说明: 如何在包检查期间有效处理未压缩的保存? 我将对象保存为:

save(mat1,file="mat1.rda",compress="xz")
save(mat2,file="mat2.rda",compress="xz")

但是,生成的 R 对象非常大(8.7MB 和 8.9 MB),并且 R CMD CHECK --as-cran 给了我注释:

 * checking installed package size ... NOTE
   installed size is 20.1Mb
   sub-directories of 1Mb or more:
   data  20.0Mb

据我了解,不能将 R 包提交给没有“通过”(即没有注释或警告)R CMD CHECL --as-cran 的 CRAN。有没有办法将数据集压缩得更小?

4

2 回答 2

6

真的有必要包含这些文件吗?我看到几个选项:

  • 包括您在示例中使用的矩阵的较小子集。
  • 即时生成矩阵,例如使用随机数。
  • 将文件放在某处以供下载,并确保示例不执行。
于 2014-04-22T07:39:34.803 回答
1

考虑将数据分发到单独的数据包中,该数据包将只构建、上传和安装一次(希望如此)。将此与更新软件包时一遍又一遍地重新传输相同数据所需的工作进行比较。

(当然,这仅适用于您打算为您的包提供更新的情况。如果您的代码从一开始就完美无缺 ;-) )

于 2014-04-22T20:21:48.850 回答