0

您好,我在公司的代理服务器下运行,我遇到了 nltk.download() 作为代理阻止它的问题。

我尝试过使用传递代理的方法

nltk.set_proxy(' http://xxxxxx :*****@www.abc.xy:8080')

这是行不通的。我已经创建了 nltk_data 的子文件夹来存储我将从 nltk 数据中获取的包,但我的问题是我不知道将下载的包放在这些子文件夹中的什么位置。

注意:子文件夹是:chunkers、grammars、misc、sentiment、taggers、corpora、help、models、stemmers、tokenizers;因此,如果我下载 porter stemmer 或 Punkt Tokenizer Models 在哪里解压缩它们。谢谢

4

1 回答 1

1

这是 nltk 的 github 存储库。该链接显示了 nltk_data 的目录结构。希望这可以帮助

https://github.com/nltk/nltk_data/tree/gh-pages/packages

于 2019-09-24T13:56:25.323 回答