以下问题(this one)对我没有帮助。
我有一个大数据集,我想知道哪些列与目标变量最相关。我知道,就我而言,对于目标变量中的每个类,不同的列有不同的影响。
在那个问题中,建议的答案建议使用 LDA。据我了解,它看起来像一个正常的分类算法,所以它不是我需要的
我是什么
In :
magic_function("name_of_target_variable_1")
Out :
["really_important_column_a", "really_important_column_b" ...]
In :
magic_function("name_of_target_variable_2")
Out :
["really_important_column_a", "really_important_column_f" ...]
我怎样才能得到这个结果?有没有办法,首先?