Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我正在加载一个大型数据集,我需要过滤大约 1/20 的行,然后按 5 列 group_by 并总结剩下的 3 个。
此页面https://vroom.r-lib.org/articles/benchmarks.html 说由于惰性 altrep 实现,采样、过滤和分组聚合要快得多。
因为“一旦一个特定的向量完全实现,所有后续操作的速度应该与正常的 R 向量相同。” 我的问题是,过滤后使用 dtplyr 或 data.table 进行汇总操作是否有意义?