data.table？

问问题 2021-12-09T00:28:23.700

44 次

我正在加载一个大型数据集，我需要过滤大约 1/20 的行，然后按 5 列 group_by 并总结剩下的 3 个。

此页面https://vroom.r-lib.org/articles/benchmarks.html 说由于惰性 altrep 实现，采样、过滤和分组聚合要快得多。

因为“一旦一个特定的向量完全实现，所有后续操作的速度应该与正常的 R 向量相同。” 我的问题是，过滤后使用 dtplyr 或 data.table 进行汇总操作是否有意义？

0 回答 0