我有一个由 25 col 和 ~1M 行组成的数据框,分成 12 个文件,现在我需要导入它们,然后使用一些reshape
包来进行一些数据管理。每个文件都太大了,我不得不寻找一些“非 RAM”的解决方案来进行导入和数据处理,目前我不需要做任何回归,我只会有一些关于数据框的描述性统计。
我搜索了一下,找到了两个包:ff
and filehash
,我先阅读filehash
手册,发现它看起来很简单,只是添加了一些将数据帧导入文件的代码,其余的似乎与通常的R操作相似。
我还没有尝试过ff
,因为它有很多不同的课程,我想知道ff
在我真正的工作开始之前是否值得花时间来了解自己。但是filehash
包似乎有一段时间是静态的,关于这个包的讨论很少,我想知道是否filehash
已经变得不那么流行了,甚至已经过时了。
谁能帮我选择使用哪个包?或者谁能告诉我它们之间的区别/优缺点是什么?谢谢。
更新01
我目前正在filehash
用于导入数据帧,并意识到它导入的数据帧filehash
应该被视为只读,因为该数据帧中的所有进一步修改都不会存储回文件,除非您再次保存它,这不是很方便在我看来,因为我需要提醒自己做储蓄。对此有何评论?