我有几组词,例如在A组中:苹果、梨、香蕉、水果、葡萄、西瓜;B组:猫、动物、狗、猪、猴、鸭;C组:意大利、澳大利亚、国家、中国、希腊。
如何自动识别这 3 组的上位词(例如,A 组的水果,B 组的动物和 C 组的国家)?非常感谢。
我有几组词,例如在A组中:苹果、梨、香蕉、水果、葡萄、西瓜;B组:猫、动物、狗、猪、猴、鸭;C组:意大利、澳大利亚、国家、中国、希腊。
如何自动识别这 3 组的上位词(例如,A 组的水果,B 组的动物和 C 组的国家)?非常感谢。
您可以使用内置于nltk
. 有关更多信息,请在此处查看此问题:Determining Hypernym or Hyponym using wordnet nltk
然而,重要的是要理解上位词的识别只会与训练数据允许的一样好。除了使用标记数据进行训练之外,没有用于识别相似对象分组的神奇系统。