我有一个脚本,可以将系统日志文件读入 pandas 数据帧并从中生成图表。这些图表适用于小型数据集。但是当我面对更大的数据集时,由于数据收集的时间范围更大,图表变得太拥挤而无法辨别。
我计划重新采样数据框,以便如果数据集通过一定大小,我将重新采样它,因此最终只有 SIZE_LIMIT 行数。这意味着我需要过滤数据帧,以便每个 n = actual_size/SIZE_LIMIT 行都会聚合到新数据帧中的一行。聚合可以是平均值,也可以是第 n 行。
我对熊猫并不完全精通,所以可能错过了一些明显的手段。