我正在使用一个超过 10GB 的数据集。我已经设法使用以下代码将其导入到 dask 数据框中:
df = dd.read_csv('FileName.csv', dtype = dt, parse_dates = ['date'])
dt = ... # a list of columns names with their data type such as 'objects' and 'floats'.
我一直在尝试运行一个.describe()
函数,但我不断收到错误消息:ValueError: No non-trivial arrays found
有谁知道如何克服这个错误?