我有一个 Rdata frame
列是逻辑变量。我需要在所有可能的列对之间进行某种点积。
这源于文本语料库分析,其中数据框指示哪些术语(行)存在于哪些文档(列)中。daisy
对于希望使用from cluster
package 或cosine
from package计算每个可能的列对的距离的情况,有一些常见的快速解决方案lsa
。
但是,我需要在所有列对之间使用某种点积来代替:目标是计算比较的两个文档中同时存在多少个单词(并且对于每一对)。
我有一个 Rdata frame
列是逻辑变量。我需要在所有可能的列对之间进行某种点积。
这源于文本语料库分析,其中数据框指示哪些术语(行)存在于哪些文档(列)中。daisy
对于希望使用from cluster
package 或cosine
from package计算每个可能的列对的距离的情况,有一些常见的快速解决方案lsa
。
但是,我需要在所有列对之间使用某种点积来代替:目标是计算比较的两个文档中同时存在多少个单词(并且对于每一对)。