我尝试在 Koalas dataframe 中创建一个新列df
。数据框有 2 列:col1
和col2
. 我需要创建一个新列newcol
作为col1
和col2
值的中位数。
import numpy as np
import databricks.koalas as ks
# df is Koalas dataframe
df = df.assign(newcol=lambda x: np.median(x.col1, x.col2).astype(float))
但我收到以下错误:
PandasNotImplementedError:该方法
pd.Series.__iter__()
未实现。如果要将数据收集为 NumPy 数组,请改用“to_numpy()”。
我也试过:
df.newcol = df.apply(lambda x: np.median(x.col1, x.col2), axis=1)
但它没有用。