1

我正在尝试在 python 中使用创建标签云,pytagcloud并且我正在使用以下代码来生成它:

from pytagcloud import create_tag_image, make_tags
from pytagcloud.lang.counter import get_tag_counts

with open("fileName.txt") as file:
  Data1 = file.read().lower()
  Data = Data1.split()

Data = "%s " * len(Data) % tuple(Data)
tags = make_tags(get_tag_counts(Data), maxsize=150)

create_tag_image(tags, 'cloud_large.png', size=(1200, 800))

代码运行没有错误(虽然需要一段时间),但它生成的输出文件非常混乱且不易阅读。这是输出文件:

标签云

为什么我会在中心出现这种奇怪的不可读的矩阵状混乱?我怎样才能摆脱它?标签云似乎不在文件的中心,怎么办?

任何帮助将不胜感激。

PS - 我正在使用 Python 2.7

4

1 回答 1

3

如果它仍然相关,我为解决这个问题所做的就是为 minsize 参数添加值并过滤掉所有最小的单词(可能在文本中出现一次)。我猜它的发生是因为单词数量的爆炸式增长。

我的代码看起来像:

tags = make_tags(get_tag_counts(MY_TEXT), maxsize=120, minsize=5)
tags = [a for a in tags if a['size'] > 7]
create_tag_image(tags, 'images/cloud_large.png', size=(900, 600), fontname='Reenie Beanie', background=(0,0,0))

结果: 在此处输入图像描述

我根据经验选择了这些值。

于 2014-08-11T08:07:21.287 回答