1

我有这个数据集:https ://www.kaggle.com/abcsds/pokemon/download 。我加载了它并做了一些更改:

import pandas as pd 
import matplotlib.pyplot as plt 
import seaborn as sns
import os
for dirname, _, filenames in os.walk('/kaggle/input'):
    for filename in filenames:
        print(os.path.join(dirname, filename))

pokemons=pd.read_csv('../input/pokemon/Pokemon.csv')

del pokemons['Type 2']
pokemons.rename(columns={'Type 1':'Type'},inplace=True)

我想要的是为每个 pokemons 类型的每个统计数据制作一些 swarmplots,hue=Legendary。我想想象一下传说中的口袋妖怪是如何分布的。我已经做了没有色调的swarmplots。首先,我需要融化数据框:

pok_melt=pd.melt(pokemons,id_vars=['Name','Type','Legendary'],value_vars=['HP','Defense','Attack','Sp. Atk','Sp. Def','Speed'])
pok_melt.head()  

然后,swarmplots 的代码(有一次我需要按字母顺序为另一个图排序的类型名称,这就是它们被排序的原因):

list_types=pokemons['Type'].unique().tolist() 
list_types.sort()
list_types

plt.figure(figsize=(17,22))
k=1
for i in list_types:
    plt.subplot(6,3,k)
    k=k+1
    sns.swarmplot(x=pok_melt.variable,y=pok_melt[pok_melt.Type==i].value,palette='gist_stern')
    plt.title(i)
    plt.xlabel('')

这些是一些swarmplots:

在此处输入图像描述

所以我试着这样做:

plt.figure(figsize=(17,22))
k=1
for i in list_types:
    plt.subplot(6,3,k)
    k=k+1
    sns.swarmplot(x=pok_melt.variable,y=pok_melt[pok_melt.Type==i].value,palette='gist_stern',
    hue=pok_melt.Legendary)
    plt.title(i)
    plt.xlabel('')

我得到这个错误:IndexError: boolean index did not match indexed array along dimension 0; 维度为 69,但对应的布尔维度为 800

4

1 回答 1

1

过滤列Legendary类似y参数:

plt.figure(figsize=(17,22))
k=1
for i in list_types:
    plt.subplot(6,3,k)
    k=k+1
    sns.swarmplot(x=pok_melt.variable,
                  y=pok_melt[pok_melt.Type==i].value,
                  hue=pok_melt[pok_melt.Type==i].Legendary,
                  palette='gist_stern')
    plt.title(i)
    plt.xlabel('')

或者更好的是只过滤一次变量df并将列分配df['value']y和:df['Legendary']hue

plt.figure(figsize=(17,22))
k=1
for i in list_types:
    plt.subplot(6,3,k)
    k=k+1
    df = pok_melt.loc[pok_melt.Type==i]

    sns.swarmplot(x=pok_melt.variable,
                  y=df['value'],
                  hue=df['Legendary'],
                  palette='gist_stern')
    plt.title(i)
    plt.xlabel('')
于 2019-09-27T10:15:13.773 回答