0

我正在从文件中读取输入,并为每行中的单词计算基于 wordnet 的相似性/相关性度量,例如 LIN、Banerjee 和 Pedersen 度量 (BNP)、Jiang 和 Conrath 度量 (JNC)。我正在使用以下代码来获取同义词集:

synsets=[]
for entry in line1:
   synsets.append(wn.synsets(entry)[0])

但这只会让我在对应词的同义词集中获得第一种意义。但在某些情况下,我可能想要第 2 或第 3 或其他含义,具体取决于单词。例如:对于水,第一种感觉是 H2O,但我想选择第二种感觉,即“水体”。如何在没有用户提示的情况下使代码更具适应性?

4

1 回答 1

1

通常,当您测量单词 A 和单词 B 之间的相似度时,您会将 A 的每个意义与 B 的每个意义进行比较,并将最接近的意义之间的相似度作为您的相似度分数。

如果您有每个单词出现的大量上下文(...河岸......将钱存入银行...),您可以使用它来确定“银行”的含义相关的。

于 2013-06-20T07:46:18.433 回答