0

vdf = vaex.open('test_*.hdf5')在 Python 中,我使用 vaex ( )从多个 hdf5 文件中打开一个数据框。一切似乎都运行良好,例如将两列组合成一个新列 ( vdf['newcol'] = vdf.x+vdf.y)。

但我无法让 vaex 的 groupby 工作:vdf.groupby('x', agg='count')抛出TypeError: unhashable type: 'Expression'.

x是整数列还是字符串列似乎并不重要。当我只读取一个 hdf5 文件时它工作得很好,但是一旦将多个文件组合到一个 vaex 数据帧中就会失败。此错误的原因可能是什么,我该如何解决?

4

1 回答 1

1

您运行的是哪个版本的 Vaex?如果以下示例适用于您,则意味着从源代码安装时已修复:

import vaex
import vaex.ml

df1 = vaex.ml.datasets.load_iris()
df2 = vaex.ml.datasets.load_iris()

df = vaex.concat([df1, df2])
df.groupby('class_', agg='count')

如果上面的例子适合你,你已经可以尝试最新的 alpha 版本了pip

于 2020-10-19T22:56:45.697 回答