问题标签 [word-cloud]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
javascript - d3 词云 - 重叠过多
我正在使用来自http://www.jasondavies.com/wordcloud/#http%3A%2F%2Fen.wikipedia.org%2Fwiki%2F%7Bword%7D=cloud的 d3 示例来构建我自己的词云。
我要做的就是根据单词表示的对象的属性将一些颜色属性添加到单词中。
例如,有 4 个单词——美国、印度、英国和德国——我使用阈值来设置单词的颜色——假设这更像是根据人口密度设置颜色。
然而,这绝不会影响字体的大小——这可能表示该国的土地面积。
我的问题是这些词都相互重叠。
我想知道我可能做错了什么-请参阅此代码-我的“绘图”功能。我在这里做错了什么?
如果我需要分享任何其他代码 - 让我知道。
谢谢你。
javascript - 与词云生成器(D3.JS)的碰撞
我正在尝试使用 World Cloud Generator:http ://www.jasondavies.com/wordcloud/about/ 这是一个与 D3.JS 一起使用的插件。
这是我的代码:
我已经有一个单词数组:words_tab
。
我的问题是:在网站上,Jason Davies(作者)对碰撞检测进行了编码。但是当我的数组中有很多单词时,它们会相互重叠......
我错过了什么吗?
word-frequency - 词频图
我想制作一个函数,它从文本输入中产生一个像这样在图片中的词频图。这张照片是从一份报告中拍摄的,所以我不确定他们是如何制作的。
javascript - 使用 Symfony2 在 TWIG 中制作词云
我想在我主页上的 Symfony2 项目中创建一个词云(标签云)。我认为它应该在为我的主页呈现的 TWIG 中完成,方法是将包含我的标签及其频率的数组传递给它。
但这就是我所知道/猜测的全部!接下来应该做什么,如何为每个标签创建 css 以及应该如何(javascript/html/...),我不知道!
任何人都可以帮助我吗?
PS:我是一个新手,还没有弄清楚 javascripts 如何与树枝一起工作!
r - r wordcloud 外部 ttf vfont 无法识别
我已经安装了“extrafont”包,以便通过 ttf_import() 方法安装外部字体库Duality 。但是,当通过 wordcloud 方法指定字体时,我收到以下错误:
安装命令:
词云命令:
输出:
为了验证确实安装了字体,我发出了以下命令
为什么对偶字体对 wordcloud 的 vfont 参数不可见?以及如何使其对 Cairo(默认渲染器)可见。蒂亚!
javascript - 重构词云算法
作为词云渲染算法的一部分(受此问题的启发),我创建了一个 Javascript / Processing.js 函数,该函数沿不断增加的螺旋线移动单词的矩形,直到不再与先前放置的单词发生冲突。它有效,但我对代码质量感到不舒服。
所以我的问题是:我怎样才能将这段代码重组为:
- 可读+易懂
- 快(不做无用的计算)
- 优雅(使用几行代码)
我也很感激任何关于进行大量计算编程的最佳实践的提示。
solr - 在索引的 lucene 文档的子集中获取最常用的术语
让我们假设以下场景。
Lucene 文档:ArticleDocument
字段:{Id, text, publisherId}
发布者可以发布多篇文章。
问题
我想为每个Publisher Id构建词云(最常见的词,带状疱疹) 。
经过调查,我可以找到方法来获取整个索引或文档但不是文档子集的最常用术语。我发现了一个类似的问题,但那是 Lucene 2.x,我希望在最近的 Lucene 中存在一种有效的方法。
请您指导我在Lucene 4.x(首选)或 3.x(最新版本 3)中执行该操作的方法。
请注意,我不能让每个 Publisher 都成为一个将所有文章都附加到一个字段的文档。
那是因为我希望云中的这些词可以搜索到相应的文章(通过相同的发布者 ID)作为结果。
我不确定维护两种类型的 lucene 文档(文章和发布者)在维护和性能方面是否是一个好主意。
r - r wordclouds中的彩色类别
在 RI 中使用 wordcloud 包希望根据数据集中的分类变量为不同的单词着色。说我的数据如下:
在这里作为dput
:
wordcloud() 中有没有办法按组(x,y,z)为名称着色,还是我应该使用不同的软件/包?
python-2.7 - 如何在没有拥挤图像的情况下使用 pytagcloud 构建干净的词云 - Python
在上一个问题中,我向社区询问了如何计算一个句子中每个连续两个单词的频率,我得到了很好的答案!现在我正在尝试使用包pytagcloud从结果中构建一个词云。
我确实遇到的问题是,制作的图片很拥挤,而且文字都在接吻。任何想法是否有分隔单词并使它们可读的功能,或者是否有任何替代方法可以在 python 中做到这一点。
谢谢!
我的代码如下。这是我用于测试的文本链接我尝试使用较少数量的单词组合,但这并没有改变图片中文本的拥挤度。
我还添加了一些功能,例如玩“布局”和“大小”和“fontname ='Lobster'和fontzoom = 1”,但它们都没有给出最佳结果,这是一个干净的词云图片,单词不拥挤。
php - php词云翻译
我已经创建了一个词云,我想在我的网页中添加一个翻译功能。我的词云显示了很多不同颜色和字体大小的词。我的系统就像分析文本并生成词云词,然后将它们回显出来。
我使用谷歌翻译,结果是这样的: 你可以看到,我真正想要翻译的内容仍然没有改变。我怎么解决这个问题。
谢谢