0

我有一个包含大量 JSON 的 7z 存档。遍历存档并读取每个 JSON 的最有效(=最快)方法是什么?

我的目标是从存档中的每个 JSON 中提取某个密钥,最好不要将未压缩的文件提取并保存到磁盘。结果应该是一个腌制的熊猫数据框。


这个问题可能通过使用py7zr指向正确的方向。我找到了readall() -方法,但似乎出了点问题。

import py7zr
import re
from py7zr import FILTER_BROTLI

filters = [{'id': FILTER_BROTLI, 'level': 9}]

with py7zr.SevenZipFile('testzip.7z', 'r', filters=filters) as zip:
    for fname, bio in zip.readall().items():
        print('{:s}: {:X}...'.format(name, bio.read(10)))

只退货

UnsupportedCompressionMethodError: Unauthorized and modified Brotli data (skipable frame) found.

似乎 Brotli 存在一些问题。有什么线索吗?

4

0 回答 0