0

我是新手,非常感谢您的建议

我想制作共现矩阵,并点击下面的链接

如何使用R创建单词共现矩阵

但我不明白为什么 AA 的值在下面的 matirx 中是 10 应该是 4 不是吗?因为有四个A

dat <- read.table(text='film tag1 tag2 tag3

  • 1 AAA

  • 2 ACF

  • 3 BDC',标题=T)

crossprod(as.matrix(mtabulate(as.data.frame(t(dat[, -1])))))

( ) ACFBD

10 1 1 0 0

C 1 2 1 1 1

F 1 1 1 0 0

乙 0 1 0 1 1

D 0 1 0 1 1

4

1 回答 1

1

您使用的解决方案假定每个标签在每部电影中只出现一次,据我所知,这与共现矩阵的定义相吻合。因此,A第一行中的每一个都被视为与自身和其他两个 s 共同出现,当考虑到第二行上的A因素时,总共有 10 次共同出现。A

于 2017-11-01T13:39:27.930 回答