526

在散点图的 pyplot 文档中:

matplotlib.pyplot.scatter(x, y, s=20, c='b', marker='o', cmap=None, norm=None,
                          vmin=None, vmax=None, alpha=None, linewidths=None,
                          faceted=True, verts=None, hold=None, **kwargs)

标记大小

s:以点^2为单位的大小。它是与 x 和 y 长度相同的标量或数组。

是什么样的单位points^2?这是什么意思?是什么s=100意思10 pixel x 10 pixel

基本上我正在尝试制作具有不同标记大小的散点图,我想弄清楚这个s数字是什么意思。

4

6 回答 6

568

这可能是定义大小的一种有点混乱的方式,但您基本上是在指定标记的区域。这意味着,要将标记的宽度(或高度)加倍,您需要增加s4 倍。 [因为 A = W H => (2W) (2H)=4A]

但是,以这种方式定义标记的大小是有原因的。由于面积缩放为宽度的平方,因此将宽度加倍实际上似乎将尺寸增加了 2 倍以上(实际上它增加了 4 倍)。要了解这一点,请考虑以下两个示例及其产生的输出。

# doubling the width of markers
x = [0,2,4,6,8,10]
y = [0]*len(x)
s = [20*4**n for n in range(len(x))]
plt.scatter(x,y,s=s)
plt.show()

在此处输入图像描述

请注意大小如何迅速增加。如果相反,我们有

# doubling the area of markers
x = [0,2,4,6,8,10]
y = [0]*len(x)
s = [20*2**n for n in range(len(x))]
plt.scatter(x,y,s=s)
plt.show()

在此处输入图像描述

现在,标记的表观大小以直观的方式大致线性增加。

至于“点”的确切含义,出于绘图目的,它是相当随意的,您可以将所有尺寸按一个常数缩放,直到它们看起来合理为止。

希望这可以帮助!

编辑:(回应@Emma的评论)

我的措辞可能令人困惑。问题是关于将圆的宽度加倍,所以在第一张图片中每个圆(当我们从左到右移动时)它的宽度是前一个的两倍,所以对于该区域,这是一个以 4 为底的指数。类似地,第二个例子每个圆圈的面积是最后一个圆圈的两倍,它给出了以 2 为底的指数。

然而,在第二个例子中(我们正在缩放区域),加倍区域似乎使圆对眼睛来说大了一倍。因此,如果我们想让一个圆看起来n更大,我们将把面积增加一个因子n而不是半径,这样表观尺寸就与面积成线性关系。

编辑以可视化@TomaszGandor 的评论:

这是标记大小的不同功能的样子:

指数、正方形或线性大小

x = [0,2,4,6,8,10,12,14,16,18]
s_exp = [20*2**n for n in range(len(x))]
s_square = [20*n**2 for n in range(len(x))]
s_linear = [20*n for n in range(len(x))]
plt.scatter(x,[1]*len(x),s=s_exp, label='$s=2^n$', lw=1)
plt.scatter(x,[0]*len(x),s=s_square, label='$s=n^2$')
plt.scatter(x,[-1]*len(x),s=s_linear, label='$s=n$')
plt.ylim(-1.5,1.5)
plt.legend(loc='center left', bbox_to_anchor=(1.1, 0.5), labelspacing=3)
plt.show()
于 2013-02-13T18:59:40.663 回答
302

因为这里的其他答案声称s表示标记的区域,所以我添加了这个答案以澄清情况不一定如此。

以点为单位的大小^2

s中的参数plt.scatter表示markersize**2. 正如文件所说

s:标量或类似数组,形状(n,),可选
大小,以点^2为单位。默认为 rcParams['lines.markersize'] ** 2。

这可以从字面上理解。为了获得一个 x 点大的标记,您需要将该数字平方并将其提供给s参数。

所以线图的标记大小和散点大小参数之间的关系是正方形。为了生成与大小为 10 点的绘图标记相同大小的散点标记,您可以调用scatter( .., s=100).

在此处输入图像描述

import matplotlib.pyplot as plt

fig,ax = plt.subplots()

ax.plot([0],[0], marker="o",  markersize=10)
ax.plot([0.07,0.93],[0,0],    linewidth=10)
ax.scatter([1],[0],           s=100)

ax.plot([0],[1], marker="o",  markersize=22)
ax.plot([0.14,0.86],[1,1],    linewidth=22)
ax.scatter([1],[1],           s=22**2)

plt.show()

连接到“区域”

那么为什么其他答案甚至文档在涉及参数时都谈到“区域” s

当然点**2的单位是面积单位。

  • 对于方形标记的特殊情况,标记marker="s"的面积确实直接是s参数的值。
  • 对于一个圆,圆的面积是area = pi/4*s
  • 对于其他标记,甚至可能与标记的区域没有任何明显的关系。

在此处输入图像描述

s然而,在所有情况下,标记的面积都与参数成比例。这就是将其称为“区域”的动机,尽管在大多数情况下并非如此。

到目前为止,根据与标记面积成比例的某个量来指定散射标记的大小是有意义的,因为当比较不同的斑块而不是其边长或直径时,感知到的是标记的面积。即,将基础数量加倍应该使标记的面积加倍。

在此处输入图像描述

什么是积分?

到目前为止,散布标记的大小意味着什么的答案是以点为单位给出的。点通常用于排版,其中字体以点指定。线宽通常以点为单位指定。matplotlib 中点的标准大小是每英寸 72 点 (ppi) - 1 点因此是 1/72 英寸。

能够以像素而不是点为单位指定大小可能很有用。如果图形 dpi 也是 72,则 1 点是 1 个像素。如果图形dpi不同(matplotlib默认为fig.dpi=100),

1 point == fig.dpi/72. pixels

虽然散点标记的点大小因此对于不同的图形 dpi 看起来会有所不同,但可以生成一个 10 x 10 像素^2 的标记,它总是覆盖相同数量的像素:

在此处输入图像描述 在此处输入图像描述 在此处输入图像描述

import matplotlib.pyplot as plt

for dpi in [72,100,144]:

    fig,ax = plt.subplots(figsize=(1.5,2), dpi=dpi)
    ax.set_title("fig.dpi={}".format(dpi))

    ax.set_ylim(-3,3)
    ax.set_xlim(-2,2)

    ax.scatter([0],[1], s=10**2, 
               marker="s", linewidth=0, label="100 points^2")
    ax.scatter([1],[1], s=(10*72./fig.dpi)**2, 
               marker="s", linewidth=0, label="100 pixels^2")

    ax.legend(loc=8,framealpha=1, fontsize=8)

    fig.savefig("fig{}.png".format(dpi), bbox_inches="tight")

plt.show() 

如果您对数据单元的分散感兴趣,请查看此答案

于 2017-11-21T00:49:20.717 回答
32

它是标记的区域。我的意思是,如果你有s1 = 1000,那么s2 = 4000每个圆的半径之间的关系是:r_s2 = 2 * r_s1。见下图:

plt.scatter(2, 1, s=4000, c='r')
plt.scatter(2, 1, s=1000 ,c='b')
plt.scatter(2, 1, s=10, c='g')

在此处输入图像描述

当我看到这个帖子时,我也有同样的疑问,所以我做了这个例子,然后我在屏幕上用尺子测量了半径。

于 2016-04-20T19:24:33.900 回答
32

您可以使用标记大小在绘图方法中指定圆的大小

import numpy as np
import matplotlib.pyplot as plt

x1 = np.random.randn(20)
x2 = np.random.randn(20)
plt.figure(1)
# you can specify the marker size two ways directly:
plt.plot(x1, 'bo', markersize=20)  # blue circle with size 10 
plt.plot(x2, 'ro', ms=10,)  # ms is just an alias for markersize
plt.show()

这里

在此处输入图像描述

于 2017-04-13T06:54:20.497 回答
8

为此,我最初也尝试使用“分散”。在浪费了相当多的时间之后 - 我选择了以下解决方案。

import matplotlib.pyplot as plt
input_list = [{'x':100,'y':200,'radius':50, 'color':(0.1,0.2,0.3)}]    
output_list = []   
for point in input_list:
    output_list.append(plt.Circle((point['x'], point['y']), point['radius'], color=point['color'], fill=False))
ax = plt.gca(aspect='equal')
ax.cla()
ax.set_xlim((0, 1000))
ax.set_ylim((0, 1000))
for circle in output_list:    
   ax.add_artist(circle)

在此处输入图像描述

这是基于对 这个问题的回答

于 2017-06-05T18:20:46.407 回答
2

如果圆的大小对应于参数的s=parameter平方,则为附加到大小数组的每个元素分配一个平方根,如下所示:s=[1, 1.414, 1.73, 2.0, 2.24]这样当它获取这些值并返回它们时,它们的相对大小增加将是平方级数的平方根,返回线性级数。

如果我要在输出到绘图时对每一个进行平方:output=[1, 2, 3, 4, 5]. 尝试列表解释:s=[numpy.sqrt(i) for i in s]

于 2015-05-26T20:47:22.723 回答