python - 如何从一组单词中自动识别上位词？

翻译自：https://stackoverflow.com/questions/44941604 2017-07-06T06:47:13.393

458 次

0

我有几组词，例如在A组中：苹果、梨、香蕉、水果、葡萄、西瓜；B组：猫、动物、狗、猪、猴、鸭；C组：意大利、澳大利亚、国家、中国、希腊。

如何自动识别这 3 组的上位词（例如，A 组的水果，B 组的动物和 C 组的国家）？非常感谢。

1 回答 1

1

您可以使用内置于nltk. 有关更多信息，请在此处查看此问题：Determining Hypernym or Hyponym using wordnet nltk

然而，重要的是要理解上位词的识别只会与训练数据允许的一样好。除了使用标记数据进行训练之外，没有用于识别相似对象分组的神奇系统。

于 2017-07-06T07:12:17.197 回答