列出所有语料库 ID 并设置_status_cache[pkg.id] = 'installed'。
它将所有语料库的状态值设置为“已安装”,当我们使用nltk.download().
如果您不确定需要哪个语料库/包,而不是下载所有语料库和模型,请使用nltk.download('popular').
import nltk
dwlr = nltk.downloader.Downloader()
for pkg in dwlr.corpora():
dwlr._status_cache[pkg.id] = 'installed'
dwlr.download('popular')
下载特定文件夹的所有包。
import nltk
dwlr = nltk.downloader.Downloader()
# chunkers, corpora, grammars, help, misc,
# models, sentiment, stemmers, taggers, tokenizers
for pkg in dwlr.packages():
if pkg.subdir== 'taggers':
dwlr.download(pkg.id)