2

现在我正在尝试比较两个不同文件中的单词,一个是英文,一个是中文。我必须确定是否有任何英文单词与中文单词相关,如果它们是,它们是否相等或者是另一个的上位词。我可以使用英语的同义词,但我能对中文单词做什么?

4

1 回答 1

1

台湾一所大学似乎有一个中文(cmn)WordNet:http: //casta-net.jp/~kuribayashi/multi/。如果这个 WordNet 与英文 WordNet 的格式相同,那么您可能可以使用 WordNetCorpusReader ( http://nltk.googlecode.com/svn/trunk/doc/api/nltk.corpus.reader.wordnet-pysrc.html# WordNetCorpusReader ) 在 NLTK 中导入普通话数据。我不知道你是如何在两个数据集之间进行对齐或翻译的,但假设你可以将英文映射到中文,这应该可以帮助你弄清楚两个英文单词之间的关系与两个普通话单词之间的关系如何。请注意,如果您的数据使用简化脚本,您可能还需要在使用此 cmn WordNet 之前转换为传统脚本。

于 2013-07-02T16:34:41.653 回答