0

是讨论维基百科转储以及如何使用多流的文章的链接,这样我就不必打开整个文件来解析它。是它建议使用的库。

我的问题是我不知道如何正确使用索引文件或该库来正确解析文件。当我尝试解压缩它时,我只读取了一系列空字节“b''”。我想要做的是能够一次解析几千个字符的文件,这样我就可以将它们用于我的 NLP 应用程序。

提前致谢。

4

0 回答 0