我想用 for 循环计算 R 中特征选择的 t-Statistic。数据有 155 列,因变量是二进制的(诱变剂 - 非诱变剂)。我想为每一列分配一个 t-stat。问题是我不知道怎么写。
这是我试图在 R 中实现的公式:
我也写了一个代码,但我不确定它只是第一列。我需要将它写在所有列的 for 循环中。
abs(diff(tapply(train_df[,1], train_df$Activity, mean))) / sqrt(sd((train_df$NEG_01_NEG[train_df$Activity == "mutagen"])^2) / (length(train_df$NEG_01_NEG[train_df$Activity == "mutagen"])) +
sd((train_df$NEG_01_NEG[train_df$Activity != "mutagen"])^2) / (length(train_df$NEG_01_NEG[train_df$Activity != "mutagen"])))
提前致谢!