从 hadoop 工作时,我正在尝试使用 MIT jwi wordnet 界面。此接口使用 RAMDictionary 对象,其构造函数需要接收指示 wordnet 文件夹位置的文件。我已将此文件夹复制到 hdfs,但无法从中创建文件对象,只能创建路径。
任何人都知道我该如何解决这个问题?
这取决于你想要做什么。
你说你在 Hadoop 上工作。您是否尝试使用 Hadoop 自己处理 WordNet 字典文件?如果是这样,您可能不需要 RAMDictionary,只需要解析器。例如:
// for each line in each WordNet data file
ISynset synset = DataLineParser.getInstance().parseLine(line);
// do stuff with each synset
但是,如果您正在处理其他内容并希望使用 WordNet 词典作为工具来帮助您完成此操作,那么是的,这会稍微复杂一些。你可以: