http://spark.apache.org/docs/latest/mllib-feature-extraction.html#word2vec
在word2vec的spark实现上,当迭代次数或数据分区数大于1时,由于某种原因,余弦相似度大于1。
据我所知,余弦相似度应始终约为 -1 < cos < 1。有人知道为什么吗?
http://spark.apache.org/docs/latest/mllib-feature-extraction.html#word2vec
在word2vec的spark实现上,当迭代次数或数据分区数大于1时,由于某种原因,余弦相似度大于1。
据我所知,余弦相似度应始终约为 -1 < cos < 1。有人知道为什么吗?