2

我想使用 cuML LinearRegression 计算 y_value 在 x_value 上的滚动斜率。

样本数据(cuDF 数据框):

| date       | x_value | y_value |
| ------     | ------  |  ----   |
| 2020-01-01 | 900     | 10      |
| 2020-01-01 | 905     | 15      |
| 2020-01-01 | 910     | 15      |
| 2020-01-01 | 915     | 15      |
| 2020-01-02 | 900     | 30      |
| 2020-01-02 | 905     | 40      |
| 2020-01-02 | 910     | 50      |
| ------     | ------  | ------  |

使用 LinearRegression 的简单函数:

def RollingOLS(x, y):
    lr = LinearRegression(fit_intercept = True, normalize = False, algorithm = 'svd')
    reg = lr.fit(x, y)
    
    return reg.coef_

我想做的事:

data.groupby('date').rolling(2).apply(RollingOLS, x=x_value, y=y_value)

但是,我收到一个错误:NotImplementedError: Handling UDF with null values is not yet supported. 有没有办法克服这个错误?谢谢你。

4

1 回答 1

1

为了解决错误,NotImplementedError: Handling UDF with null values is not yet supported请将None/null值重新分配给另一个值或None/null从您的 DataFrame 中删除具有值的样本。

于 2020-08-03T08:01:21.730 回答