15

Pandas 中的数据框具有箱线图方法,但是有没有办法在 Pandas 中创建箱图,或者使用seaborn

通过点箱图,我的意思是一个箱线图,它显示了图中的实际数据点(或它们的相关样本),例如下面的示例(在 R 中获得)。

在此处输入图像描述

4

2 回答 2

18

对于与 OP 的问题(使用 Pandas)相关的更准确的答案:

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

data = pd.DataFrame({ "A":np.random.normal(0.8,0.2,20),
                      "B":np.random.normal(0.8,0.1,20), 
                      "C":np.random.normal(0.9,0.1,20)} )

data.boxplot()

for i,d in enumerate(data):
    y = data[d]
    x = np.random.normal(i+1, 0.04, len(y))
    plt.plot(x, y, mfc = ["orange","blue","yellow"][i], mec='k', ms=7, marker="o", linestyle="None")

plt.hlines(1,0,4,linestyle="--")

箱形图


旧版本(更通用):

使用 matplotlib :

import numpy as np
import matplotlib.pyplot as plt

a = np.random.normal(0,2,1000)
b = np.random.normal(-2,7,100)
data = [a,b]

plt.boxplot(data) # Or you can use the boxplot from Pandas

for i in [1,2]:
    y = data[i-1]
    x = np.random.normal(i, 0.02, len(y))
    plt.plot(x, y, 'r.', alpha=0.2)

这给出了: 点箱图

灵感来自本教程

希望这可以帮助 !

于 2014-05-16T13:22:24.880 回答
11

使用该stripplot函数的 seaborn 版本 0.6(目前在 github 上的 master 分支中)可以实现这一点。这是一个例子:

import seaborn as sns
tips = sns.load_dataset("tips")
sns.boxplot(x="day", y="total_bill", data=tips)
sns.stripplot(x="day", y="total_bill", data=tips,
              size=4, jitter=True, edgecolor="gray")

在此处输入图像描述

于 2015-02-17T16:16:43.903 回答