我有一组表格列表(大约 100 个),[6, 17, 5, 1, 4, 7, 14, 19, 0, 10]我想得到一个箱线图,它绘制所有列表的箱线图信息(即中位数、最大值、最小值、Q1、Q3、异常值)的平均值。
例如,如果我有 2 个列表
l1 = [6, 17, 5, 1, 4, 7, 14, 19, 0, 10]
l2 = [4, 12, 3, 5, 16, 0, 14, 7, 8, 15]
我可以得到列表的最大值、中值和最小值的平均值,如下所示:
maxs = np.array([])
mins = np.array([])
medians = np.array([])
for l in [l1, l2]:
medians = np.append(medians, np.median(l))
maxs = np.append(maxs, np.max(l))
mins = np.append(mins, np.min(l))
averMax = np.mean(maxs)
averMin = np.mean(mins)
averMedian = np.mean(medians)
我应该对箱形图中的其他信息执行相同的操作,例如平均 Q1、平均 Q3。然后,我需要使用这些信息(averMax、averMin 等)仅绘制一个箱形图(而不是一个图中的多个箱形图)。
我从使用 matplotlib 绘制箱线图知道您不必计算普通箱线图的值。您只需要将数据指定为变量。是否可以对我的情况做同样的事情,而不是手动计算所有列表的平均值?
