我有一个由 1 和 0 组成的数据框,它们充当元数据来描述主数据集的某些特征的属性。作为数据探索的一部分,我在数据帧上运行以下代码,以将这些特征标记表示为 2D 图。
mca = prince.MCA()
mca_mtx = mca.fit(tags_df).transform(tags_df)
但我遇到fit以下错误:
数组不得包含 infs 或 nans
检查数据框后,我发现整个数据集中没有 infs 或 nans。所以问题一定是别的。
有人知道如何解决这个问题吗?
显然这是一个已知的错误。问题在于 dataframe 的值tags_df,因为1.0和0.0正在产生inf或nan在mca算法期间。
我尝试通过1.0and 0.0by Trueand False(bool type)改变这些,但没有成功。然而,字符串版本成功了,那就是"True"and "False"。所以以下行解决了我的问题:
tags_df.replace({0: "False", 1: "True"}, inplace = True)