我以这种方式使用dask读取了 csv 文件:
import dask.dataframe as dd
train = dd.read_csv('act_train.csv')
然后我想对每行应用简单的逻辑,这在熊猫中工作得很好:
columns = list(train.columns)
for col in columns[1:]:
train[col] = train[col].apply(lambda x: x if x == -1 else x.split(' ')[1])
不幸的是,最后一行代码生成以下错误:值的长度与索引的长度不匹配
我究竟做错了什么?