我正在尝试通过arelle解析 xbrl 文件(1.35Gb) 。在调试过程中,我发现执行保持在ModelDocument.py:157行。它保持超过30分钟。Python 进程占用大约 8Gb RAM 并缓慢增加内存消耗:
看起来 python 以 20-50Kb/s 的速度解析 xml,这非常慢。特别是如果我们考虑到 python 有C
优化代码。另请注意,我有 1 个核心 100% 加载,因此 CPU 做了一些繁重的工作(但究竟是什么?)
任何想法如何加快 xbrl 解析?
系统:Windows 10、Python 3.7.3 (v3.7.3:ef4ec6ed12, Mar 25 2019, 22:22:05)