我正在尝试从 Konkani 语言的语料库中找出新概念。我已经在 1) 特定领域的语料库 2) 报纸语料库上训练了两个模型。
我已经使用 Gensim word2vec 来训练模型,但是我无法在向量空间中非常接近的情况下获得具有相似含义的术语。
结束词之间没有同义词的关系。它们的相似性就像一些随机单词一样好。
我究竟做错了什么?
我正在尝试从 Konkani 语言的语料库中找出新概念。我已经在 1) 特定领域的语料库 2) 报纸语料库上训练了两个模型。
我已经使用 Gensim word2vec 来训练模型,但是我无法在向量空间中非常接近的情况下获得具有相似含义的术语。
结束词之间没有同义词的关系。它们的相似性就像一些随机单词一样好。
我究竟做错了什么?