0

我想通过 a 从 Jupyter-notebook 中的一些 pandas DataFrame 中选择数据,SelectionRangeSlider并使用 holoviews 条形图绘制过滤后的数据。

考虑以下示例:

import numpy as np
import pandas as pd
import datetime
import holoviews as hv
hv.extension('bokeh')

import ipywidgets as widgets

start = int(datetime.datetime(2017,1,1).strftime("%s"))
end = int(datetime.datetime(2017,12,31).strftime("%s"))

size = 100
rints = np.random.randint(start, end + 1, size = size)
df = pd.DataFrame(rints, columns = ['zeit'])
df["bytes"] = np.random.randint(5,20,size=size)
df['who']= np.random.choice(['John', 'Paul', 'George', 'Ringo'], len(df))
df["zeit"] = pd.to_datetime(df["zeit"], unit='s')
df.zeit = df.zeit.dt.date

df.sort_values('zeit', inplace = True)
df = df.reset_index(drop=True)
df.head(2)

这给出了测试 DataFrame df在此处输入图像描述

让我们对数据进行分组:

data = pd.DataFrame(df.groupby('who')['bytes'].sum())
data.reset_index(level=0, inplace=True)
data.sort_values(by="bytes", inplace=True)
data.head(2)

在此处输入图像描述

现在,创建SelectionRangeSlider用于过滤和更新条形图的。

%%opts Bars [width=800 height=400 tools=['hover']]
def view2(v):
    x = df[(df.zeit > r2.value[0].date()) & (df.zeit < r2.value[1].date())]
    data = pd.DataFrame(x.groupby('who')['bytes'].sum())
    data.sort_values(by="bytes", inplace=True)
    data.reset_index(inplace=True)
    display(hv.Bars(data, kdims=['who'], vdims=['bytes']))

r2 = widgets.SelectionRangeSlider(options = options, index = index, description = 'Test')
widgets.interactive(view2, v=r2)

在此处输入图像描述

(我已经在 github 上创建了一个关于滑块没有正确显示标签的问题,https://github.com/jupyter-widgets/ipywidgets/issues/1759

持续存在的问题:

  • 图像宽度和大小在第一次更新后折叠为默认值(有没有办法%%opts作为参数提供hv.Bars?)

  • y-Scale 应保持不变(即所有更新从 0 到 150)

  • 关于更新速度是否有任何优化?

谢谢你的帮助。

4

1 回答 1

0

想出如何使用bokehhttps ://github.com/bokeh/bokeh/issues/7082

于 2017-10-21T17:08:13.790 回答