0

我有一个包含大约 60 列、超过 100k 行的数据集。第一变量“组”将数据分为两组。第一组包含 85% 的观察,第二组包含 15%。主要目标是找出这些组之间的差异。3 列是分类的,其余的是数字变量。54 列几乎只包含 NaN 值。当我删除所有 NaN 时,我丢失了所有行。我应该使用什么样的分析、绘图或测试以及如何处理这么多的 NaN 值?

4

0 回答 0