1

是否vaex有任何实用函数可以帮助检查两个数据帧之间的相等性?

例如:pandas必须pandas.testing.assert_frame_equal检查两个框架是否包含相同的列和值,这在编写单元测试时非常好。有没有类似的东西vaex?或者也许有另一种方便的方法来实现这一点?

4

1 回答 1

4

没有实用程序,但我认为拥有它是个好主意(如果你关心,你可以在https://github.com/vaexio/vaex/issues打开一个问题):

一个简短的版本是(忽略 NaN):

import vaex
df1 = vaex.example()
df2 = vaex.example()

df = df1.join(df2, rprefix='rhs_')  # join based on rows number
column_names = df1.get_column_names()
equal = all((df[name] != df["rhs_" + name]).sum() == 0 for name in column_names)
print(equal)

True
于 2020-01-28T16:55:38.767 回答