0

我正在加载一个大型数据集,我需要过滤大约 1/20 的行,然后按 5 列 group_by 并总结剩下的 3 个。

此页面https://vroom.r-lib.org/articles/benchmarks.html 说由于惰性 altrep 实现,采样、过滤和分组聚合要快得多。

因为“一旦一个特定的向量完全实现,所有后续操作的速度应该与正常的 R 向量相同。” 我的问题是,过滤后使用 dtplyr 或 data.table 进行汇总操作是否有意义?

4

0 回答 0