我有大约 20-30 个 dbf 文件,我在 R 中导入了这些文件。我无法将它们组合在一个数据框/表中,因为总文件大小约为 2 GB。我想在每个文件“avg_spends”中按年龄分组创建新列,并在每个文件中创建多个列。
当我将文件合并到一个数据表中,然后使用 dplyr 执行以下命令时。
file_combo <- dbf_file %>% group_by(ctg, age) %>% mutate(avg_spends =
mean(total_spend)
这只是第一步。同样,我必须根据以前可用/创建的列创建新列。我如何通过第一个 col-files1、files、2 等拆分文件来完成这项工作。
我还需要分别为每个文件输出
这是我拥有的数据的一个示例
files || age || ctg || total_spend
==================================
file1 || 45 || 1 || 1026
file1 || 26 || 2 || 1574
file1 || 45 || 1 || 64
file1 || 32 || 1 || 1610
file2 || 41 || 1 || 884
file2 || 22 || 1 || 530
file2 || 41 || 2 || 451
file2 || 22 || 1 || 520
file3 || 21 || 2 || 727
file3 || 34 || 1 || 562
file3 || 43 || 2 || 452
file3 || 23 || 1 || 851