我正在学习评估文档之间的文本相似性。浏览有关该主题的 text2vec 教程 ( http://text2vec.org/similarity.html ),我注意到代码返回了两个相似度值。这是 Dmitriy Selivanov 教程中代码的结尾:
d1_d2_cos_sim = sim2(dtm1, dtm2, method = "cosine", norm = "l2")
dim(d1_d2_cos_sim)
[1] 300 200
哪个返回值(300 或 200)描述了文本相似性/差异?