简短版本:
如果我有一个词干词:
Say 'comput' for 'computing', or 'sugari' for 'sugary'
有没有办法构造它最接近的名词形式?
That is 'computer', or 'sugar' respectively
更长的版本:
我正在使用 python 和 NLTK,Wordnet 对一堆单词执行一些语义相似性任务。
我注意到大多数 sem-sim 分数只适用于名词,而形容词和动词没有任何结果。
了解所涉及的不准确之处,我想将一个单词从它的动词/形容词形式转换为它的名词形式,所以我可以估计它们的相似性(而不是通常与形容词一起返回的“NONE”)。
我认为做到这一点的一种方法是使用词干分析器来获取词根,然后尝试构造最接近该词根的名词形式。
George-Bogdan Ivanov 从这里开始的算法效果很好。我想尝试其他方法。有没有更好的方法将单词从形容词/动词形式转换为名词形式?