python - 如何在 python 脚本中从 wordnet:synset 中选择所需的意义

Question

我正在从文件中读取输入，并为每行中的单词计算基于 wordnet 的相似性/相关性度量，例如 LIN、Banerjee 和 Pedersen 度量 (BNP)、Jiang 和 Conrath 度量 (JNC)。我正在使用以下代码来获取同义词集：

synsets=[]
for entry in line1:
   synsets.append(wn.synsets(entry)[0])

但这只会让我在对应词的同义词集中获得第一种意义。但在某些情况下，我可能想要第 2 或第 3 或其他含义，具体取决于单词。例如：对于水，第一种感觉是 H2O，但我想选择第二种感觉，即“水体”。如何在没有用户提示的情况下使代码更具适应性？

score 1 · Accepted Answer

通常，当您测量单词 A 和单词 B 之间的相似度时，您会将 A 的每个意义与 B 的每个意义进行比较，并将最接近的意义之间的相似度作为您的相似度分数。

如果您有每个单词出现的大量上下文（...河岸...和...将钱存入银行...），您可以使用它来确定“银行”的含义相关的。

1 回答 1