似乎dask
不支持读取包含标题的 CSV 文件。当我尝试阅读它时,我得到
TypeError: 'NoneType' object has no attribute '__getitem__'
我可以毫无问题地使用 pandas 和没有标题的 dask 读取相同的文件,但它们 dask 将第一行属性作为标题。这是一个错误吗?
Dask.dataframe支持带有标题的 CSV 文件:
In [1]: cat foo.csv
name,amount
alice,100
bob,200
In [2]: import dask.dataframe as dd
In [3]: dd.read_csv('foo.csv').compute()
Out[3]:
name amount
0 alice 100
1 bob 200
但通常 CSV 文件可能很棘手。如果您对失败的示例文件提出问题,我们可以追踪正在发生的事情并解决问题。