Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
这是讨论维基百科转储以及如何使用多流的文章的链接,这样我就不必打开整个文件来解析它。这是它建议使用的库。
我的问题是我不知道如何正确使用索引文件或该库来正确解析文件。当我尝试解压缩它时,我只读取了一系列空字节“b''”。我想要做的是能够一次解析几千个字符的文件,这样我就可以将它们用于我的 NLP 应用程序。
提前致谢。