1

我正在对更大的数据集进行采样,以使用 statsmodels GLM 模型进行拟合和预测。

根据示例,运行model.predict将省略它返回的数组中的一些少量(<10)记录。我假设它在处理数据集中的少量行时遇到了一些错误。

例如,如果我预测使用第 15000:20000 行,则返回的数组的形状将是 4994、4997 或类似的东西。

这很痛苦,因为我不知道哪些行被省略了,我想在整个数据帧上运行 .predict 函数,然后轻松地将预测值添加为新列。

是否有人(a)知道发生了什么以及如何修复它,或者(b)有一个很好的方法可以根据索引将预测值添加回数据帧?

4

0 回答 0