考虑一个具有多列的 Pandas 数据框,每列一个国家名称,多行,每行一个日期。这些单元格是有关国家/地区的数据,这些数据会随时间变化。这是 CSV:
我想在 Jupyter 中制作一个动态图(动画),显示数据如何随时间演变。在世界上所有国家中,我只想展示在任何给定时间排名前 10 的国家。因此图中显示的国家/地区可能会不时发生变化(因为前 10 名正在演变)。
这是我拥有的代码(编辑:现在您可以将代码复制/粘贴到 Jupyter 中,它开箱即用,因此您可以轻松看到我正在谈论的错误):
import pandas as pd
import requests
import os
from matplotlib import pyplot as plt
import matplotlib.animation as ani
rel_big_file = 'rel_big.csv'
rel_big_url = 'https://pastebin.com/raw/bJbDz7ei'
if not os.path.exists(rel_big_file):
r = requests.get(rel_big_url)
with open(rel_big_file, 'wb') as f:
rel_big = pd.read_csv(rel_big_file, index_col='Date')
# history of top N countries
champs = []
# frame draw function
def animate_graph(i=int):
N = 10
# get current values for each country
last_index = rel_big.index[i]
# which countries are top N in last_index?
topN = rel_big.loc[last_index].sort_values(ascending=False).head(N).index.tolist()
# if country not already in champs, add it
for c in topN:
if c not in champs:
# pull a standard color map from matplotlib
cmap = plt.get_cmap("tab20")
# draw legend
# make a temporary dataframe with only top N countries
rel_plot = rel_big[topN].copy(deep=True)
# plot temporary dataframe
p = plt.plot(rel_plot[:i].index, rel_plot[:i].values)
# set color for each country based on index in champs
for i in range(0, N):
p[i].set_color(cmap(champs.index(topN[i]) % 20))
%matplotlib notebook
fig = plt.figure(figsize=(10, 6))
plt.xticks(rotation=45, ha="right", rotation_mode="anchor")
# x ticks get too crowded, limit their number
animator = ani.FuncAnimation(fig, animate_graph, interval = 333)
它完成了这项工作 - 有点。我将排名靠前的国家存储在冠军列表中,并根据每个国家在冠军中的索引分配颜色。但是根据 champs 中的索引,仅正确分配了绘制线的颜色。
绘制线条的颜色遵循 champs 中的索引。图例中国家的颜色基于图例中的顺序。这不是我想要的。