7

我正在尝试基于 Pandas groupby 对象生成子图网格。我希望每个图都基于一组 groupby 对象的两列数据。假数据集:

C1,C2,C3,C4
1,12,125,25
2,13,25,25
3,15,98,25
4,12,77,25
5,15,889,25
6,13,56,25
7,12,256,25
8,12,158,25
9,13,158,25
10,15,1366,25

我尝试了以下代码:

import pandas as pd
import csv   
import matplotlib as mpl
import matplotlib.pyplot as plt
import math

#Path to CSV File
path = "..\\fake_data.csv"

#Read CSV into pandas DataFrame
df = pd.read_csv(path)

#GroupBy C2
grouped = df.groupby('C2')

#Figure out number of rows needed for 2 column grid plot
#Also accounts for odd number of plots
nrows = int(math.ceil(len(grouped)/2.))

#Setup Subplots
fig, axs = plt.subplots(nrows,2)

for ax in axs.flatten():
    for i,j in grouped:
        j.plot(x='C1',y='C3', ax=ax)

plt.savefig("plot.png")

但它会生成 4 个相同的子图,每个子图上都绘制了所有数据(请参见下面的示例输出):

在此处输入图像描述

我想做类似以下的事情来解决这个问题:

for i,j in grouped:
    j.plot(x='C1',y='C3',ax=axs)
    next(axs)

但我得到这个错误

AttributeError:“numpy.ndarray”对象没有属性“get_figure”

我将在要绘制的 groupby 对象中拥有动态数量的组,以及比我提供的假数据更多的元素。这就是为什么我需要一个优雅的动态解决方案,并且每个组数据集都绘制在一个单独的子图上。

4

1 回答 1

12

听起来您想要并行地迭代组和轴,因此您不需要嵌套for循环(迭代每个轴的所有组),而是需要这样的东西:

for (name, df), ax in zip(grouped, axs.flat):
    df.plot(x='C1',y='C3', ax=ax)

在此处输入图像描述

您在第二个代码片段中有正确的想法,但是您遇到了错误,因为axs它是一个轴数组,但plot只需要一个轴。因此,next(axs)在您的示例中替换ax = axs.next()并更改plotto的参数也应该有效ax=ax

于 2015-05-21T17:21:54.983 回答