我对 R 有点陌生,我遇到了一个问题。我有一个正在处理的数据集,并试图对其中的两列进行卡方检验。但是,每当我在 R 中调用表函数来制作交叉表以在卡方检验中使用时,它都会添加 0 的行和列,即使任何一列中都没有零。这导致我的卡方检验产生一个 nan 的 p 值,我无法弄清楚这个额外的零列和零行是从哪里来的。
copy = ecomm_df[!(is.na(ecomm_df$profile) | is.na(ecomm_df$purchasedBefore)),]
tab = table(copy$profile,copy$purchasedBefore)
chi_test = chisq.test(tab)
chi_test$expected
copy
下面是我在两个数据框列上调用 table 的示例
这些额外的行和列可能来自哪里?