0

我有用户的历史数据——我想拟合普通最小二乘回归来找出趋势。

我的数据看起来像

user_id    rating   item_id   date
12            3       19     2010-03-17
13            4       20     2010-03-18
1             3       123    2010-03-19
12            3.5     340    2010-03-17
19            2       19     2010-04-17

这是我的功能

def coef(y):
    s = y.shape[0]
    A = np.vstack([range(s), np.ones(s)]).T
    m, c = np.linalg.lstsq(A, y, rcond=None)[0]
    return(m)

我希望做类似以下的事情

mydt[:, coef(dt.f.rating), dt.by(dt.f.user_id)]

或者一些如何针对每个用户 ID 运行此功能。不幸的是,数据太大,我无法使用 Pandas !非常感谢听到关于替代品的信息。

4

0 回答 0