我正在研究一个具有数字特征的数据集,我想计算这些特征的 PMI(逐点互信息)。
例如,我有以下内容:
test_features = [[1,1], [1,0], [0,1], [0,0]]
test_labels = [1,1,0,0]
目标类为 1。
在这种情况下如何计算 PMI?
编辑:
预期输出:{feature: pmi} 形式的字典,其中每个特征都由其 ID 表示(在 1-hot 编码表示中的位置)
我正在研究一个具有数字特征的数据集,我想计算这些特征的 PMI(逐点互信息)。
例如,我有以下内容:
test_features = [[1,1], [1,0], [0,1], [0,0]]
test_labels = [1,1,0,0]
目标类为 1。
在这种情况下如何计算 PMI?
编辑:
预期输出:{feature: pmi} 形式的字典,其中每个特征都由其 ID 表示(在 1-hot 编码表示中的位置)