我使用 R 在中大型数据集上拟合大量 GLM。我的模型中通常有 500k-1M 行和多达 50 个因子(在简化之前 - 带状或删除不可预测的因子等)
Base Rglm()
似乎不能很好地应对这种规模的问题。我可以并且确实使用revoScaleR::rxGlm()
,这在这方面要好得多,但这有其自身的问题(不完整的文档,无法使用其他设计用于处理glm
对象的 R 函数等)。
有没有我不知道的替代方案?目前这种事情首选的 glm 包是什么?
(我现在确实需要坚持 GLM 框架——我可能会在某个时候分支到其他建模技术——其中当然有很多——但这是以后的一种......)
谢谢。