r - R中ff和filehash包的区别

翻译自：https://stackoverflow.com/questions/9918459 2012-03-29T02:47:35.830

1170 次

我有一个由 25 col 和 ~1M 行组成的数据框，分成 12 个文件，现在我需要导入它们，然后使用一些reshape包来进行一些数据管理。每个文件都太大了，我不得不寻找一些“非 RAM”的解决方案来进行导入和数据处理，目前我不需要做任何回归，我只会有一些关于数据框的描述性统计。

我搜索了一下，找到了两个包：ffand filehash，我先阅读filehash手册，发现它看起来很简单，只是添加了一些将数据帧导入文件的代码，其余的似乎与通常的R操作相似。

我还没有尝试过ff，因为它有很多不同的课程，我想知道ff在我真正的工作开始之前是否值得花时间来了解自己。但是filehash包似乎有一段时间是静态的，关于这个包的讨论很少，我想知道是否filehash已经变得不那么流行了，甚至已经过时了。

谁能帮我选择使用哪个包？或者谁能告诉我它们之间的区别/优缺点是什么？谢谢。

我目前正在filehash用于导入数据帧，并意识到它导入的数据帧filehash应该被视为只读，因为该数据帧中的所有进一步修改都不会存储回文件，除非您再次保存它，这不是很方便在我看来，因为我需要提醒自己做储蓄。对此有何评论？

0 回答 0