2

我有一个 Rdata frame列是逻辑变量。我需要在所有可能的列对之间进行某种点积

这源于文本语料库分析,其中数据框指示哪些术语(行)存在于哪些文档(列)中。daisy对于希望使用from clusterpackage 或cosinefrom package计算每个可能的列对的距离的情况,有一些常见的快速解决方案lsa

但是,我需要在所有列对之间使用某种点积来代替:目标是计算比较的两个文档中同时存在多少个单词(并且对于每一对)。

4

1 回答 1

4

让我们使用这个例子:

df <- data.frame(x1 = c(T, T, F), x2 = c(F, F, F), x3 = c(T, F, T))

我会将 data.frame 转换为矩阵,然后计算叉积:

crossprod(data.matrix(df))
#    x1 x2 x3
# x1  2  0  1
# x2  0  0  0
# x3  1  0  2
于 2014-05-24T21:52:17.897 回答