我有用户的历史数据——我想拟合普通最小二乘回归来找出趋势。
我的数据看起来像
user_id rating item_id date
12 3 19 2010-03-17
13 4 20 2010-03-18
1 3 123 2010-03-19
12 3.5 340 2010-03-17
19 2 19 2010-04-17
这是我的功能
def coef(y):
s = y.shape[0]
A = np.vstack([range(s), np.ones(s)]).T
m, c = np.linalg.lstsq(A, y, rcond=None)[0]
return(m)
我希望做类似以下的事情
mydt[:, coef(dt.f.rating), dt.by(dt.f.user_id)]
或者一些如何针对每个用户 ID 运行此功能。不幸的是,数据太大,我无法使用 Pandas !非常感谢听到关于替代品的信息。