我有以下代码:
feature_array = da.concatenate(features, axis=1)#.compute()
model = KMeans(n_clusters=4)
model.fit(features, y=None)
现在,如果我首先计算 feature_array 这段代码运行得很好,但是没有它它会给出一些我无法弄清楚的内部 TypeError:
File "/Users/(...)/lib/python3.7/site-packages/dask_ml/utils.py", line 168, in check_array
sample = np.ones(shape=shape, dtype=array.dtype)
File "/Users/(...)/lib/python3.7/site-packages/numpy/core/numeric.py", line 207, in ones
a = empty(shape, dtype, order)
TypeError: 'float' object cannot be interpreted as an integer
我不应该在 dask_ml 中使用 dask 数组吗?我想使用 dask_ml 的主要原因是我希望这段代码能够在大于内存的数据集上运行。
干杯,弗洛里安