我有一个 json 行文件,其中每一行都有一些我试图(主要)扁平化的结构,因此:
with open("/home/igor/data/feed.jsonl") as json_file:
thelist2 = []
for line in json_file:
thelist2.append(json_normalize(json.loads(line)))
其次pd.concat(thelist2)
上面的语义是正确的,但不太好的是这非常慢,而在没有的情况下运行上面json_normalize
的速度非常快(但做错了)。有没有办法在事后规范化数据帧,或者其他更快的方案?