问题标签 [carrot2]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
116 浏览

matrix - Carrot2 文档相似度以及 tf-idf 矩阵中的有序文档索引如何?

我正在尝试使用胡萝卜确定两个文档之间的相似性。是否有可能直接从框架中获得这种相似性?

此外,我一直在研究 tf-idf 矩阵,并意识到行对应于文档中的所有单词和列。但是,如何识别哪个文档对应于哪个列?

例如,假设一个文档列表,列顺序会是列表中文档的顺序吗?

前任:

列出文档 = {doc1, doc2, doc3}

列 0 = doc1 列 1 = doc2

...

这是?

0 投票
1 回答
144 浏览

carrot2 - lingo 算法的最大分值是多少?

我想生成集群结果的词云,但要做到这一点,我需要知道 Lingo 算法的最大分值。有人知道答案吗?

0 投票
1 回答
233 浏览

java - 无法在 Ubuntu 14.04 中启动 Carrot2 工作台

当我尝试在 Ubuntu 14.04 中启动 carrot2-workbench 64 位 linux 可执行文件时,出现错误

可能是什么问题?

0 投票
2 回答
445 浏览

ubuntu - 无法在我的 Ubuntu 14.04 上运行适用于 64 位 Linux(版本 3.9.4)的 Carrot2 Document Clustering Workbench

我已经为 64 位 Linux 版本 3.9.4 下载了 Carrot2 Document Clustering Workbench,并尝试在我的 Ubuntu GNU/Linux 14.04 上运行它。

首先我收到一个错误:

然后我安装了以下内容,希望能修复上面的错误:

然后我尝试再次运行工作台,但这次我收到了:

它在启动屏幕上得到了堆栈,永远等待。

有什么想法可以解决这个问题并运行工作台吗?

0 投票
2 回答
92 浏览

lucene - Carrot2 3.9.4 升级到 Lucene 4.7+

尝试连接到 4.7 以上的 Lucene 索引时出错:

处理错误:org.apache.lucene.index.IndexFormatTooNewException:不支持格式版本(资源:MMapIndexInput(path="C:\kcp-search-data\kcp-index_2.cfs") [slice=_2_Lucene41_0.doc]) : 1 (需要在 0 和 0 之间) org.apache.lucene.index.IndexFormatTooNewException: 不支持格式版本 (资源: MMapIndexInput(path="C:\kcp-search-data\kcp-index_2.cfs") [slice=_2_Lucene41_0.doc]): 1(需要在 0 和 0 之间)

此错误的任何解决方法?知道什么时候会发布带有升级的 Lucenee 库的 Carrot2 的下一个版本吗?

谢谢

0 投票
1 回答
143 浏览

solr - 在 Solr 上标记 Carrot2 Lingo Clustering 的集群标签

我使用 Carrot2 Lingo 聚类算法来聚类我的 Solr 搜索结果。现在我想进一步处理聚类标签,因此我需要对标签进行标记,以便每个标签一个接一个地获取它们。

是否有某种 post tokenizer 可用于实现此目的,还是我必须自己处理结果?

谢谢你的帮助!

蒂姆

0 投票
1 回答
619 浏览

solr - 在胡萝卜2 聚类标签中强制或增强单词

我正在使用 Carrot2 对来自 Solr 的查询结果进行聚类。是否可以强制(或至少提高)标签中某些单词的出现,无论是 Lingo、STC 还是 k-means?

使用 Lingo,这已经可以通过“标题词提升”选项实现,它赋予文档标题中出现的词更多的权重。这可以扩展到我可以提供的其他词吗?

我想至少应该可以将所需的单词附加到“标题词提升”选项正在使用的字符串中,以让词提升工作,但也许这不是正确的方法。

这样做的方法是什么?

0 投票
1 回答
150 浏览

xml - Carrot2 工作台无法处理大数据

我想使用carrot2 工作台对我的数据集进行聚类。我有一个带有文档的输入 xml 文件65536。我正在使用 Lingo 聚类算法。

但是当我开始这个过程时,工作台会在几秒钟内返回结果,所有文档都在“其他主题”集群中。

我用较小的数据集检查了聚类,我得到了结果。

0 投票
1 回答
368 浏览

data-visualization - Carrot2 泡沫树 API

我正在研究 Carrot2 FoamTree API,特别是研究大型层次聚类,我需要知道是否有办法将叶节点作为超链接发布,单击时会在新窗口中打开链接?

0 投票
3 回答
144 浏览

elasticsearch-plugin - 没有找到结果插件carrot2+elasticsearch

下午好!

你能帮我解决一些错误吗?我有旧版本的 Elasticsearch 1.3.4 并安装了插件 Carrot2 Clustering 插件 1.7.0。我将 Elasticsearch 升级到 1.5.0 版本,插件 Carrot2 Clustering 插件 1.8.0。

现在我正在尝试使用 Elasticsearch 的插件头在插件胡萝卜2 中创建集群。当我写插件头 POST http://localhost:9200/name_index/_search_with_clusters

{"search_request":{"fields":["message", "url"],"query":{"match":{"_all":"play"}},"size":100},"query_hint":"play","algorithm":"lingo","field_mapping":{"message":["fields.message"], "url":["fields.url"]}}

我得到的结果类似于插件胡萝卜2 文档中的示例中描述的结果。但是当我尝试在插件carrot2中创建集群时,我得到“找不到结果”(我尝试了两个不同的索引并且情况相同)

如果我写的话{"search_request":{"fields":["CONTENT", "url"].... ,我不会得到带有内容的插件头结果,在映射中我有“消息”而不是“内容”。

你能解释一下,这可能是什么错误?

谢谢 :)