我有这个数据集:https ://www.kaggle.com/abcsds/pokemon/download 。我加载了它并做了一些更改:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import os
for dirname, _, filenames in os.walk('/kaggle/input'):
for filename in filenames:
print(os.path.join(dirname, filename))
pokemons=pd.read_csv('../input/pokemon/Pokemon.csv')
del pokemons['Type 2']
pokemons.rename(columns={'Type 1':'Type'},inplace=True)
我想要的是为每个 pokemons 类型的每个统计数据制作一些 swarmplots,hue=Legendary。我想想象一下传说中的口袋妖怪是如何分布的。我已经做了没有色调的swarmplots。首先,我需要融化数据框:
pok_melt=pd.melt(pokemons,id_vars=['Name','Type','Legendary'],value_vars=['HP','Defense','Attack','Sp. Atk','Sp. Def','Speed'])
pok_melt.head()
然后,swarmplots 的代码(有一次我需要按字母顺序为另一个图排序的类型名称,这就是它们被排序的原因):
list_types=pokemons['Type'].unique().tolist()
list_types.sort()
list_types
plt.figure(figsize=(17,22))
k=1
for i in list_types:
plt.subplot(6,3,k)
k=k+1
sns.swarmplot(x=pok_melt.variable,y=pok_melt[pok_melt.Type==i].value,palette='gist_stern')
plt.title(i)
plt.xlabel('')
这些是一些swarmplots:
所以我试着这样做:
plt.figure(figsize=(17,22))
k=1
for i in list_types:
plt.subplot(6,3,k)
k=k+1
sns.swarmplot(x=pok_melt.variable,y=pok_melt[pok_melt.Type==i].value,palette='gist_stern',
hue=pok_melt.Legendary)
plt.title(i)
plt.xlabel('')
我得到这个错误:IndexError: boolean index did not match indexed array along dimension 0; 维度为 69,但对应的布尔维度为 800