我想知道为什么使用 wiki(韩语)预训练的“fasttext 模型”似乎效果不佳!:(
模型 = fasttext.load_model("./fasttext/wiki.ko.bin")
model.cosine_similarity("테스트 테스트 이건 테스트 문장", "지금 아무 관계 없는 글 정말로 정말로")
(英文) model.cosine_similarity("test test this is test sentence", "now not all relative docs really really")
0.99....?? 那些句子根本不是相对的意思。因此,我认为余弦相似度必须更低。然而它是 0.997383...
将孤句与 fasttext 进行比较是不可能的吗?那么它是使用 doc2vec 的唯一方法吗?