0

我有 500GB 的 .csv 数据,其中包括这三个(和其他)变量:1. 乘客在哪里上火车,2. 他们在哪里下车,3. 花费的时间。

我需要根据他们在交互式 R-shiny 应用程序中的上车地点和下车地点制作所需时间的箱线图 - 这是直截了当的。但首先我需要最小化文件的大小,因为在 R 闪亮的应用程序中读取 500GB 是令人望而却步的。有没有办法以使这成为可能的方式存储这些变量?

即使使用 vroom 也需要很长时间,而且我认为 {Disk.frame} 也不会起作用。有什么想法吗?

4

0 回答 0