我正在尝试在python3中解析非常大的 gzip 压缩(10+GB)文件。我没有创建解析树,而是根据此答案中的建议使用了嵌入式操作。
但是,查看FileStream代码它想读取整个文件然后对其进行解析。这不适用于大文件。
所以,这是一个两部分的问题。
- ANTLR4 可以使用可能是自定义的文件流,允许它一次读取文件的块吗?类接口应该是什么样的?
- 基于上述“是”,该类是否需要处理查找操作,如果底层文件是 gzip 压缩的,这将是一个问题?
我正在尝试在python3中解析非常大的 gzip 压缩(10+GB)文件。我没有创建解析树,而是根据此答案中的建议使用了嵌入式操作。
但是,查看FileStream代码它想读取整个文件然后对其进行解析。这不适用于大文件。
所以,这是一个两部分的问题。