我刚刚花了一些时间研究data.table
R 并且想知道在什么条件下我可以期望获得最大的性能提升。也许简单的答案是当我有一个大的 data.frame 并且经常在这个 data.frame 的子集上操作时。当我只是加载数据文件和估计模型时,我不能期待太多,但许多[
操作会有所作为。这是真的,唯一的答案还是我应该考虑什么?什么时候开始重要?10x5、1,000x5、1,000,000x5?
编辑:一些评论表明这data.table
通常更快,同样重要的是,几乎从不慢。所以知道什么时候不使用也很好data.table
。