3

我正在使用 setuptools 来打包我的模块,该模块将经过训练的数据集用于 AI 应用程序。特别是,我使用vader_lexicon.txt的是在nltk 数据文件中找到的。

当您从 pip 安装 nltk 时,它不会自动为您下载数据集。您必须从命令行或 python 解释器手动执行命令来获取特定数据集。我怀疑他们这样做是因为包括所有数据集将是数百兆字节。

从 setuptools 的文档来看,包含数据文件的方法似乎是使用MANIFEST.in,但在这种情况下,您似乎需要将数据文件包含在源代码分发中。

有什么方法可以包含来自远程位置的数据?

4

0 回答 0