我正在努力从一年的数据集中为 50000 名客户制作小时系数。(365行*28列)
我想保存这些系数以便稍后在另一个 R 代码文件中进行预测。目前,我正在为客户使用保存功能保存 24 小时模型列表。因此,50000 个 Rda 文件(每个 7mb)。然后,分别加载(加载函数)它们以使用 R 中的预测函数进行预测。
这效率不高,现在我想为一百万客户执行此操作,这将花费大量时间和空间。有没有更好的方法来保存 lm 模型中的系数以供以后预测?
我尝试了 biglm 包,但它并没有在 Rda 文件上节省太多空间。此外,保存系数后手动乘以行将很困难,因为我有很多具有不同因子水平的变量。
谢谢!