2

我找到了这个链接,我试图了解 boxplot 是如何工作的。

http://pandas.pydata.org/pandas-docs/dev/visualization.html#box-plotting

df = DataFrame(np.random.rand(10,5))

plt.figure();
bp = df.boxplot()

我希望 boxplot 需要每个框有 4 个值,但是它似乎为每 10 个点构建一个框,我想知道后台发生了什么..

我指的四个点是胡须高、低、盒子高、低

谢谢

4

1 回答 1

5

您的DataFrame(实际数字可能因 而有所不同rand):

In [13]: df = DataFrame(np.random.rand(10, 5))

In [14]: df
Out[14]:
          0         1         2         3         4
0  0.199953  0.261683  0.582105  0.969489  0.351161
1  0.424425  0.901810  0.942510  0.985630  0.947160
2  0.809123  0.311318  0.954326  0.022269  0.472182
3  0.685818  0.172807  0.093368  0.406808  0.590702
4  0.590784  0.291439  0.139792  0.243264  0.671586
5  0.215574  0.253957  0.257037  0.895526  0.903883
6  0.469410  0.062405  0.518797  0.706974  0.956250
7  0.320845  0.924984  0.740085  0.939595  0.258833
8  0.058665  0.364624  0.832847  0.790947  0.835429
9  0.924942  0.077599  0.411044  0.075257  0.703015

Boxplot 创建五个框,对应于DataFrame. 每个方框描绘了中位数(红线)、第 25 个百分位(方框的下边缘)、第 75 个百分位(方框的上边缘)和最极端的观察值(胡须)。

那有意义吗?

于 2013-04-03T07:44:08.717 回答