2

我尝试让Koalas适应Pandas 运行良好的代码:

import pandas as pd
from databricks import koalas as ks
from sklearn import preprocessing

pdf = pd.DataFrame({'x':range(3), 'y':[1,2,5], 'z':[100,200,1000]})

df = ks.from_pandas(pdf)

min_max_scaler = preprocessing.MinMaxScaler()
result = min_max_scaler.fit_transform(df)

它在最后一行失败,并出现以下错误:

ValueError: could not convert string to float: 'x'

似乎考拉中的标题行被fit_transform函数解释为正常的行。

有什么解决方法吗?

谢谢。

4

1 回答 1

1

你会随着改变而走得更远

df = ks.from_pandas(pdf)

df = ks.from_pandas(pdf).set_index('x')

x在 pandas 和 koalas 数据框中显式创建索引列。

于 2020-08-17T21:13:52.830 回答