7

我有一个由 25 col 和 ~1M 行组成的数据框,分成 12 个文件,现在我需要导入它们,然后使用一些reshape包来进行一些数据管理。每个文件都太大了,我不得不寻找一些“非 RAM”的解决方案来进行导入和数据处理,目前我不需要做任何回归,我只会有一些关于数据框的描述性统计。

我搜索了一下,找到了两个包:ffand filehash,我先阅读filehash手册,发现它看起来很简单,只是添加了一些将数据帧导入文件的代码,其余的似乎与通常的R操作相似。

我还没有尝试过ff,因为它有很多不同的课程,我想知道ff在我真正的工作开始之前是否值得花时间来了解自己。但是filehash包似乎有一段时间是静态的,关于这个包的讨论很少,我想知道是否filehash已经变得不那么流行了,甚至已经过时了。

谁能帮我选择使用哪个包?或者谁能​​告诉我它们之间的区别/优缺点是什么?谢谢。

更新01

我目前正在filehash用于导入数据帧,并意识到它导入的数据帧filehash应该被视为只读,因为该数据帧中的所有进一步修改都不会存储回文件,除非您再次保存它,这不是很方便在我看来,因为我需要提醒自己做储蓄。对此有何评论?

4

0 回答 0