1

我有一个像这样的数据集:

df = pd.DataFrame(np.random.rand(10,2),columns=['A','B'])
df['group'] = np.random.choice(4,size=10)
df['category'] = np.random.choice(['CC','DD'],size=10)
df['sizes'] = np.random.randint(10,50,size=10)

我想要一个 A 与 B 的散点图,其中标记由“组”列着色,标记类型基于“类别”列,标记大小基于“大小”列。

以下...

scatter = df.hvplot.scatter(x='A',y='B',color='group',padding=0.1,cmap='Set1',size='sizes')
scatter

...让我得到正确的颜色,虽然我得到一个“不能为 'size' 选项声明映射”(知道为什么吗?),我实际上得到了正确的标记大小。

但是,我似乎无法根据“类别”列获得标记类型。

我努力了...

markers=['x' if zone=='DD' else 'o' for zone in df['category']]
scatter = df.hvplot.scatter(x='A',y='B',color='group',padding=0.1,cmap='Set1',size='sizes',marker=markers)
scatter

...但它将所有点转换为十字(x),而没有将所有点转换为圆(o)。

我还尝试添加一列:

df['markers'] = np.random.choice(['x','o'],size=10)

接着...

scatter = df.hvplot.scatter(x='A',y='B',color='group',padding=0.1,cmap='Set1',size='sizes',marker='markers')
scatter

...但这会引发错误并且根本不起作用。

使用 hvplot 通过变量自定义标记的正确方法是什么?

感谢您的建议。


编辑1: 现在我也尝试使用holoviews.dim,1.与holoviews:

hvd = hv.Dataset(df,['A'],['B','markers'])
markers_custom = hv.dim('markers').apply(hvd)

hvd.to.scatter().opts(marker=marker)

然后 2. 再次使用 hvplot:

scatter = df.hvplot.scatter(x='A',y='B',marker=markers_custom)

我得到:

TypeError [调用 holoviews.ipython.show_traceback() 了解详情] unhashable type: 'numpy.ndarray'

...在这两种情况下。

4

2 回答 2

3

上述方法可行,但我们非常建议不要转换您的实际数据,除非您真的需要,这就是我们引入所谓的dim表达式的原因,您可以在此处阅读。这些使您无需接触数据即可表达复杂的转换,例如,在您的示例中,您可以这样做:

import holoviews as hv

df = pd.DataFrame(np.random.rand(10,2),columns=['A','B'])
df['group'] = np.random.choice(4,size=10)
df['category'] = np.random.choice(['CC','DD'],size=10)
df['sizes'] = np.random.randint(10,50,size=10)
marker = hv.dim("category").categorize({'DD': 'x'}, default='circle')

df.hvplot.scatter(x='A',y='B', color="group", size="sizes", marker=marker)

这里的转换基本上采用类别列并通过将所有'DD'值映射到'x'并将所有其他值映射到'circle'来转换它。

于 2020-03-18T21:43:20.930 回答
2

它适用于我的自定义列:

import numpy as np, pandas as pd, holoviews as hv, hvplot.pandas
hv.extension("bokeh")
np.random.seed(3)

df = pd.DataFrame(np.random.rand(10,2),columns=['A','B'])
df['group'] = np.random.choice(4,size=10)
df['category'] = np.random.choice(['CC','DD'],size=10)
df['sizes'] = np.random.randint(10,50,size=10)
df['marker'] = df.category.replace("DD","x").replace("CC","circle")

df.hvplot.scatter(x='A',y='B', color="group", size="sizes", marker="marker")

剧情截图

于 2020-03-13T22:06:14.863 回答