我想根据我的数据的一般范围限制 y 轴边界,避免尖峰但不删除它们。
我正在制作多组图表来比较两组数据。两组都包含一年多的数据,并已使用 pandas 读入数据框,并且每个月通过循环生成图表。其中一组有埋葬尖峰,导致 y 轴上的范围绘制得过大,导致图表不可读。设置固定边界 pyplot.ylim()
无济于事,因为数据的一般范围(例如一个月内)因图表而异,并且应用硬限制会降低许多图表的可读性。
例如:一个月可能有数据通常不会高于 300,000,但有几个峰值超过 500,000(和低于 -500,000),但另一个月也可能有较大的峰值,但数据不会超过高于 150,000 的值。
我还尝试根据此答案nan
设置太大而无法使用的值,但折线图中的中断太小而无法看到,并且出现尖峰的事实会丢失。df2 = df[df.y < 500000] = np.nan
有没有办法弄清楚数据的一般最大和最小范围是什么,以便可以合理地设置 y 轴限制?