5

我正在为具有数百万个数据点的一些数据制作二维直方图。matplotlib.hist2d(x,y,bins,norm=LogNorm())效果很好并在大约 5 秒内生成一个图,但我喜欢seaborn.jointplot(). 如何使用附图seaborn.jointplot()中的点的对数密度为点着色matplotlib.hist2d()?使用 KDE 花费的时间太长(大约一分钟左右我就放弃了),而且我有很多图形要创建。所以“获得”颜色的时间是一个因素。或者,如何将边际直方图添加到matplotlib.hist2d()

plt.hist2d(x,y,100,norm=LogNorm(),cmap='jet')

在此处输入图像描述

sns.jointplot(x=x, y=y)

在此处输入图像描述

4

3 回答 3

8

可能有另一种直接的方法可以在seaborn. 我还没有找到。这是一个 hacky 示例解决方案,用于处理一些随机数据。至于你的第二个问题,我建议发布一个新问题。

诀窍是首先创建一个jointplot使用 seaborn,然后隐藏 2d-scatter 并使用重新绘制它plt.hist2d

import seaborn as sns
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.cm as cm

# some random data
x = np.random.normal(size=100000)
y = x * 3.5 + np.random.normal(size=100000)

ax1 = sns.jointplot(x=x, y=y)
ax1.ax_joint.cla()
plt.sca(ax1.ax_joint)

plt.hist2d(x, y, bins=(100, 100), cmap=cm.jet);

在此处输入图像描述

于 2018-12-28T21:52:46.697 回答
3

这是另一种类似的方法,但坚持使用 seaborn:

import seaborn as sns
import numpy as np

x = np.random.normal(size=100)
y = x * 3.5 + np.random.normal(size=100)

sns.jointplot(x=x, y=y, kind='kde', cmap='hot_r', n_levels=60, fill=True)

在此处输入图像描述

于 2018-12-29T00:03:17.583 回答
1

这是最终的图和代码。感谢@Bazingaa 的帮助。

def makesweetgraph(x=None, y=None, cmap='jet', ylab=None, xlab=None, bins=100, sets=sets, figsize=(5,4), snsbins=60):
    set1,set2 = sets
    ax1 = sns.jointplot(x=x, y=y,marginal_kws=dict(bins=snsbins))
    ax1.fig.set_size_inches(figsize[0], figsize[1])
    ax1.ax_joint.cla()
    plt.sca(ax1.ax_joint)
    plt.hist2d(x,y,bins,norm=LogNorm(),cmap=cmap)
    plt.title('%s vs %s (%.4f%% of loci)\n%s and %s' % (xlab,ylab,(len(x)/numsnps)*100,set1,set2),y=1.2,x=0.6)
    plt.ylabel(ylab,fontsize=12)
    plt.xlabel(xlab,fontsize=12)
    cbar_ax = ax1.fig.add_axes([1, 0.1, .03, .7])
    cb = plt.colorbar(cax=cbar_ax)
    cb.set_label(r'$\log_{10}$ density of points',fontsize=13)

在此处输入图像描述

于 2018-12-31T22:34:35.217 回答