我有一个逻辑稀疏矩阵,比如说m
,(可以是 , 或矩阵中的任何一个Matrix
,slam
如果SparseM
这样可以使事情变得更快)我想要执行以下操作:
for (col in 1:ncol(m)) {
print(table(m[ , col], logicalV)
}
其中logicalV
是与 中的行长度相同的固定m
逻辑向量。将此视为在 sparse 中为每个特征创建一个混淆矩阵m
。
我处理的尺寸m
是:(15 ~ 40K) x (75 ~ 125K)。这使得访问列的步骤m[ , col]
非常缓慢。
我在这里寻找的是一个快速的解决方案。有任何想法吗?
编辑:
根据评论,这里概述了我真正想要实现的目标。我有一堆特征选择指标,如信息增益、副法线分离等,它们都是混淆矩阵(即table(m[ , col], logicalV)
)的函数,因为它们是真阳性/阴性和假阳性/阴性计数的函数。所以对于每一列 and logicalV
,我需要知道 both TRUE
、 bothFALSE
和 either的计数TRUE
。这有帮助吗?