0

我知道 word2vec 是如何工作的,但是我在找出如何使用 word2vec 实现词义消歧时遇到了麻烦。你能帮忙处理一下吗?

4

1 回答 1

1

正如@sam-h 在他的评论中提到的,这是一个正在进行的研究领域。

没有标准的或自动的方法,所以没有一个最佳实践可以推荐——你可能不得不从 'sam-h 提供的列表和其他地方的各种论文中筛选,以获得想法。

在许多情况下,方法不使用标准 word2vec——在训练之前或期间添加额外的步骤——因为标准 word2vec 忽略了单个词标记可能具有多种对比意义的事实。结果,用于具有多种含义的单词的标准 word2vec 向量可以最终得到一个将多种不同含义“混合在一起”的单个向量。

一篇有趣的文章确实设法从现有的、词义遗忘的词向量中引导一个多义模型,在论文“词义的线性代数结构,与多义的应用”中进行了描述,该论文也有一个不太正式的博客文章

本质上,通过假设所有标准词向量的丰富空间实际上来自较少数量的“话语”,并将词向量解释为交替的“话语原子”的某种组合(因为它们的不同意义),他们可以挑逗-out 仅以单个向量开头的单词标记的替代意义。

于 2019-11-25T20:30:48.460 回答