3

我想创建一个包含在 Pandas 数据框中的两个系列(比如“A”和“B”)的条形图。如果我只想使用不同的 y 轴绘制它们,我可以使用secondary_y

df = pd.DataFrame(np.random.uniform(size=10).reshape(5,2),columns=['A','B'])
df['A'] = df['A'] * 100
df.plot(secondary_y=['A'])

但是如果我想创建条形图,则忽略等效命令(它不会在 y 轴上放置不同的刻度),因此“A”中的条太大以至于无法区分“B”中的条:

df.plot(kind='bar',secondary_y=['A'])

我怎样才能直接在熊猫中做到这一点?或者你将如何创建这样的图表?

我正在使用 pandas 0.10.1 和 matplotlib 1.2.1 版。

4

2 回答 2

6

不要认为熊猫图形支持这一点。做了一些手动matplotlib代码..你可以进一步调整它

import pylab as pl
fig = pl.figure()
ax1 = pl.subplot(111,ylabel='A')
#ax2 = gcf().add_axes(ax1.get_position(), sharex=ax1, frameon=False, ylabel='axes2')
ax2 =ax1.twinx()
ax2.set_ylabel('B')
ax1.bar(df.index,df.A.values, width =0.4, color ='g', align = 'center')
ax2.bar(df.index,df.B.values, width = 0.4, color='r', align = 'edge')
ax1.legend(['A'], loc = 'upper left')
ax2.legend(['B'], loc = 'upper right')
fig.show()

在此处输入图像描述

我确信有办法强制单条进一步调整它。将条移得更远,一个稍微透明等。

于 2013-06-12T10:44:26.050 回答
1

好的,我最近遇到了同样的问题,即使这是一个老问题,我想我可以为这个问题给出一个答案,以防万一其他人对此失去理智。Joop 给出了要做的事情的基础,当您的数据框中只有(例如)两列时,这很容易,但是当您的两个轴有不同数量的列时,它变得非常讨厌,因为您需要使用 pandas plot() 函数的 position 参数。在我的例子中,我使用 seaborn 但它是可选的:

import pandas as pd
import seaborn as sns
import pylab as plt
import numpy as np

df1 = pd.DataFrame(np.array([[i*99 for i in range(11)]]).transpose(), columns = ["100"], index = [i for i in range(11)])
df2 = pd.DataFrame(np.array([[i for i in range(11)], [i*2 for i in range(11)]]).transpose(), columns = ["1", "2"], index = [i for i in range(11)])

fig, ax = plt.subplots()
ax2 = ax.twinx()

# we must define the length of each column. 
df1_len = len(df1.columns.values)
df2_len = len(df2.columns.values)
column_width = 0.8 / (df1_len + df2_len)

# we calculate the position of each column in the plot. This value is based on the position definition :
# Specify relative alignments for bar plot layout. From 0 (left/bottom-end) to 1 (right/top-end). Default is 0.5 (center)
# http://pandas.pydata.org/pandas-docs/dev/generated/pandas.DataFrame.plot.html
df1_posi = 0.5 + (df2_len/float(df1_len)) * 0.5
df2_posi = 0.5 - (df1_len/float(df2_len)) * 0.5

# In order to have nice color, I use the default color palette of seaborn
df1.plot(kind='bar', ax=ax, width=column_width*df1_len, color=sns.color_palette()[:df1_len], position=df1_posi)
df2.plot(kind='bar', ax=ax2, width=column_width*df2_len, color=sns.color_palette()[df1_len:df1_len+df2_len], position=df2_posi)

ax.legend(loc="upper left")

# Pandas add line at x = 0 for each dataframe.
ax.lines[0].set_visible(False)
ax2.lines[0].set_visible(False)

# Specific to seaborn, we have to remove the background line 
ax2.grid(b=False, axis='both')

# We need to add some space, the xlim don't manage the new positions
column_length = (ax2.get_xlim()[1] - abs(ax2.get_xlim()[0])) / float(len(df1.index))
ax2.set_xlim([ax2.get_xlim()[0] - column_length, ax2.get_xlim()[1] + column_length])

fig.patch.set_facecolor('white')
plt.show()

结果:http: //i.stack.imgur.com/LZjK8.png

我没有测试所有可能性,但无论您使用的每个数据框中的列数如何,它看起来都可以正常工作。

于 2015-06-17T12:22:37.540 回答