我正在寻找一个将“妈妈”、“女性”和“女性”等词组合在一个组中的包。一般来说,根据类别对单词进行分组。在上面的例子中,类是 Person:Female。我正在使用 NLTK 相似性指标,但它们似乎对我的目的并不好。还有什么我可以看的吗?
问问题
1496 次
1 回答
0
我不确定您是否知道您正在寻找的 Wordnet 项目。对此进行了大量研究,实际上有一个全球项目将该数据库映射到其他语言。词法分析是合理的,但据我所知,数据的存储格式有点混乱。主要网站是Princeton Wordnet。此外——如果你搜索你会发现数据库的 MSSQL 版本,并且有一个客户端程序可以帮助你评估数据库是否适合你的目的——这就是所谓的“Wordnet 浏览器”。链接在这里。我输入了 Mom 并且能够从上位词相关的术语中得到 Female 、 Person 和 Mother 。这里有很多词汇要学,我自己也没有深入了解。但我希望这对你有帮助。
于 2013-08-19T22:05:49.797 回答