我正在使用 python 进行 NLP,下一步是收集有关英语语法中可用的特定主题的大量数据。
例如:所有可以定义“部门”的词都说“帐户”。
那么任何人都可以告诉我如何收集这些数据(如果可能的话,通过任何 API)。
我正在使用 python 进行 NLP,下一步是收集有关英语语法中可用的特定主题的大量数据。
例如:所有可以定义“部门”的词都说“帐户”。
那么任何人都可以告诉我如何收集这些数据(如果可能的话,通过任何 API)。
NLTK wordnet 是解决这类问题的一个很好的框架。这是一个简短的文档: http : //www.nltk.org/howto/wordnet.html 这使用诸如“synset”之类的对象,它为您提供具有共同含义的单词。还有一些方法可以得到两个单词相似度的数字分数。引理会为您提供具有相似词根含义的单词。
如果您正在寻找更多与查找相关的词(例如:“spaghetti”->“pasta”、“ravioli”、“Italy”数据库可能更好: https ://www.datamuse.com/api/