6

假设我有下面的 3x3 矩阵:

[苹果19 3.5]

[橘子07 2.2]

[葡萄23 7.8]

只有在现实生活中,矩阵有几十行,而不仅仅是三行。

我想创建一个 XY 图,其中第二列是 X 坐标,第三列是 Y 坐标,单词本身(即第一列)是标记(所以没有点、线或任何其他符号) .

我还希望每个单词的字体大小由第二列确定(例如,在上面的示例中,这意味着使“葡萄”的大小大约是“橙子”的三倍)。

最后,我想在对应于第三列的红到蓝比例上为单词着色,0 = 最深的红色,10 = 最深的蓝色。

在 Python 2.x 中最好的方法是什么?我知道我可以使用 matplotlib 的“注释”和“文本”来做很多(如果不是全部)这些事情,但不知何故,这感觉像是一种解决方法。当然必须有一种方法可以将单词声明为标记(所以我不必将它们视为“注释”)?也许matplotlib之外的东西?有没有人做过类似的事情?

4

2 回答 2

13

因为您不想使用annotate,或者text下一个最好的事情是py.scatter接受标记

``'$...$'``                    render the string using mathtext.

例如

import pylab as py

data = [["peach", 1.0, 1.0], 
        ["apples", 19, 3.5], 
        ["oranges", 7, 2.2], 
        ["grapes", 23, 7.8]]

for item in data:
    py.scatter(item[1], item[2], s=700*item[1], 
           c=(item[2]/10.0, 0, 1 - item[2]/10.0), 
           marker=r"$ {} $".format(item[0]), edgecolors='none' )

py.show()

例子

这种方法有几个问题

  • 在数学文本中使用\textrm{}以使其不是斜体似乎会破坏 matplotlib
  • 字母大小需要手动调整(因此系数为 700)

使用颜色图可能比简单地定义 RGB 颜色值更好。

于 2013-06-25T07:50:08.257 回答
4

在四处寻找解决同一问题的方法时,我发现了一个看起来更干净的方法(或者至少在精神上比原来的问题更清晰),即使用 TextPath:

from matplotlib import pyplot as plt
from matplotlib.text import TextPath

data = [["peach", 1.0, 1.0], 
        ["apples", 19, 3.5], 
        ["oranges", 7, 2.2], 
        ["grapes", 23, 7.8]]

max_d2 = max([d[2] for d in data]) + 1e-3
max_d1 = max([d[1] for d in data]) + 1e-3

cmap = plt.get_cmap('RdBu')
for d in data:
    path = TextPath((0,0), d[0])

    # These dots are to display the weakness below, remove for the actual question
    plt.plot(d[1],d[2],'.',color='k')

    plt.plot(d[1],d[2],marker=path,markersize=100, color=cmap(d[2]/max_d2))
plt.xlim([0,max_d1+5])
plt.ylim([0,max_d2+0.5])

输出图像

此解决方案有其自身的一些优点和缺点:

  • 主要缺点:如圆点所示,我无法将文本正确居中。相反,所需的值是图片的左下角。
  • 主要优点:这没有乳胶问题并使用“真实”标记路径,这意味着它可以很容易地用于标记线图(虽然不是原始问题)

代码:

import numpy as np
x = np.cumsum(np.random.randn(100,5), axis=0)

plt.figure(figsize=(15,5))
for i in range(5):
    label = TextPath((0,0), str(i), linewidth=1)
    plt.plot(x[:,i], color='k')
    plt.plot(np.arange(0,len(x),5),x[::5,i], color='k', marker=label, markersize=15, linewidth=0)

线图的输出

如果您有很多行/标记,则通过“文本”或“注释”的简单循环执行上述操作会非常慢,而这可以更好地扩展。

于 2018-04-23T09:29:42.423 回答