问题标签 [word-cloud]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
label - 从“有错别字的描述”到“标签”
背景
我确实有一个图像数据集(类似于ImageNet),每张图像都有一个“带有拼写错误的描述”。我想在这个人身上运行一些深度卷积神经网络,但我需要先生成“标签”。那么,问题来了:
问题
如何从“有错别字的描述”中生成类别的“标签”?
技术信息
该数据集有大约 1300 万张图像,带有相应的(有效的)“描述”和可选的“错别字”。“描述”的一些示例如下:
想法
我正在考虑通过以下方式解决问题。
- 修正错别字:
- 运行拼写检查以识别拼写错误;
- 找到可以解决它的更好的词,通过
- 查看数据集中的其他描述,或
- 检查图像并手动纠正错字;
- 生成最终标签:
- 在句子嵌入(将句子映射到ℝᴺ的函数)上运行聚类算法(例如 k-means)或
- 使用最经常出现的词。
javascript - D3:对词云使用强制布局
我正在研究标签可视化,其中标签在不同的力导向布局之间转换。
我在弄清楚如何从气泡图过渡到节点图时遇到了一些问题,但我对如何让图表过渡到词云有点困惑。我的困难主要源于我在编写自定义聚类/碰撞检测函数方面缺乏经验。
我将力声明为全局变量,然后在用户单击按钮时停止并启动它们:
当绘制节点的函数被调用时,相关的节点/链接函数被添加到力中(因为数据根据滑块值发生变化)。
创建节点数据的代码如下:
为了使这个问题相对简短,我用于绘制气泡图的代码是此示例的衍生代码:http: //bl.ocks.org/mbostock/7881887并且用于绘制节点图的代码同样通用(我如果它有助于解决我的问题,我很乐意提供此代码)。
这就是我的问题所在:
我发现了这个用于矩形之间碰撞检测的好例子,并将其合并到我的代码中。但是,由于我使用的是 SVG 文本并且字体大小在过渡时会发生变化,因此我选择根据文本长度和半径来估计文本大小/边界框大小。
单词图表的整个“刻度”功能如下。
我不确定如何结束聚类功能以便适当地移动节点。我试图适应标准的集群功能,即
更类似于前面提到的矩形集群力布局,但没有运气(恐怕我不再有我的确切尝试的副本)。
由于缺乏声誉,我担心我无法附上图片,但如果有帮助,我可以尝试找到一种方法来提供它们。词云的重叠问题很小(大多数词分解为相邻但不接触的位置),但如果可能的话,我希望它像气泡图一样完美地解决。我很确定这些问题源于 a.) 未完成的集群函数和 b.) 我在使用文本长度和半径来估计文本大小而不是正确的边界框坐标方面的技巧,但我不确定如何修复这些东西。
r - 如何使R词云以较浅的颜色显示最常用的术语
我用代码在 R 中创建了一个词云:
它工作得很好,只是它以这样一种方式对术语进行着色,即最常见的出现在颜色的最暗阴影中,而最不常见的出现在颜色的最浅阴影中。但我希望它是相反的方式。任何指针?谢谢。
r - 如何在多边形中获得 wordcloud
我花了好几个小时寻找这个问题的解决方案——投入了很多,但还没有找到正确的解决方案。我希望有人可以帮助我。
我的目标: 我的 wordcloud 适合定义的多边形(带有 x 和 y 坐标)。
我有两种主要方法:
- 方法:尝试使用 R 包
wordcloud
我有:
a) 完成的wordcloud
b) 定义的多边形
现在我在一个情节中与par(new=TRUE)
. 到目前为止的结果是:
如您所见,我的多边形中的单词不匹配。我的问题是我没有迹象表明 ; 的周边区域wordcloud
。我不知道在哪里传递我的多边形的坐标。
我的第一种方法的代码:
现在我的第二种方法:
2 方法:文字
在此的帮助下,我得出了以下代码:
使用该代码,结果图如下所示:
这里我们有坐标位置的单词。是否可以将坐标声明为文本的周边区域?
我希望我的一种方法可以从你们中的一位 R 专业人士那里得到解决。
在此先感谢您的帮助!如果您需要更多内容,请告诉我!
r - TermDocumentMatrix 有时会抛出错误
我正在根据来自不同运动队的推文创建一个词云。此代码成功执行大约 10 次:
10 次中的其他 9 次,它会引发以下错误:
有什么想法吗?我用谷歌搜索过,但到目前为止还不够!请记住,我是 R 中的绝对新手!
testing - 如何测试词云系统?
我需要有关测试文字云系统的帮助。
系统:系统有3个词云可视化(A、B和C)。词云 A 和 B 分别是数据集 A 和数据集 B 的输出。词云C是词云A和B之间的运算结果。
问题:我如何测试这种情况?任何人都可以给我一些该系统的测试用例和测试方法的例子。如何确保系统正常工作?
javascript - 词云中缺少 d3.js 词
js 并尝试基于 [这里] 的示例代码做词云:https ://github.com/jasondavies/d3-cloud 。我想做的是单词的字体大小基于数组中单词的频率。例如我有 [a,a,a,b,b] 所以单词 'a' 将大于 'b' 但问题是当单词的宽度或高度大于 < svg
> 单词时走了。
我想到的是先获取元素的宽度和高度,然后相应地调整 wordSize 但似乎我不能用 [d3.layout.cloud.js] 做到这一点:https ://github.com/jasondavies/d3-cloud /blob/master/d3.layout.cloud.js 谁能帮我解决这个问题?
python - IOError:无法打开资源
我在 ipython 笔记本上有一个代码,我试图在其中制作一个 wordcloud,但出现错误。据我所知,该错误与其他内容有关,而不是我的代码(与字体有关?)
我不太确定如何解释这一点。似乎我正在使用的一个类需要一些字体,并且一些字体文件会发生一些事情。任何见解将不胜感激
我以此为基础:http: //99projects.co/reports/p05-word-frequency/
json - 使用 d3.js 创建动态词云
我使用以下示例作为基础,并希望使其成为动态词云 https://github.com/jasondavies/d3-cloud
数据被添加到数组中,但我的词云没有反映新添加的词:
另外,它第一次刷新,但没有添加新词。有人可以纠正或指出我在这方面做错了什么。谢谢
r - 创建短语的“词”云,而不是 R 中的单个词
我正在尝试从短语列表中创建一个词云,其中许多是重复的,而不是单个单词。我的数据看起来像这样,我的数据框的一列是短语列表。
我想制作一个词云,其中所有这些名称都被视为显示频率的单个短语,而不是组成它们的单词。我一直在使用的代码如下所示:
这会创建一个词云,但它是每个组成词的,而不是短语的。所以,我看到了“A”的相对频率。“H”、“John”等,而不是“Joseph A”、“Mary A”等的相对频率,这正是我想要的。
我敢肯定这不是那么复杂的修复,但我无法弄清楚!我将不胜感激任何帮助。