我正在使用 python 的 nltk 学习自然语言处理。我想从我目录中的 XML 文件创建一个语料库。所以我使用了以下代码。
>> from nltk.corpus import XMLCorpusReader
>> corpus_root = "/Desktop/my_dir/corpus/"
>> wiki = XMLCorpusReader(corpus_root ,'output.xml')
>> wiki.fileids()
>>
此代码块应该将 fileid 输出为“output.xml”。但它不返回任何内容,并且光标转到下一行“>>”。我的 output.xml 位于 corpus_root 中指定的确切目录中。我拥有读取和写入文件“output.xml”的所有权限。我安装了 nltk 及其所有数据,并具有所有指定的路径。
我应该怎么做才能让它工作?