问题标签 [carrot2]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
153 浏览

algorithm - 如何在 Solr 管理控制台中指定使用 STC 算法?

我有一个在 Ubuntu 上使用 Carrot2 的测试 Solr 环境。使用 Carrot2 工作台,我可以在三种定义的算法(Lingo、STC、kmeans)之间切换。如何在 Solr 管理查询工具中做同样的事情?它是与聚类参数一起传递的参数吗?

所有 3 种算法都在 solrconfig.xml 中定义,它基本上是 collection1 中示例的副本。我推断它默认使用 Lingo,但如果我愿意,不确定在哪里将其切换到 STC。

0 投票
2 回答
127 浏览

k-means - Carrot2-bisectingKmeans设置resouceLookup的属性导致no resouces named stopwords.ar的错误

Carrot2-我尝试通过 bisectingKmeans 算法对文档进行聚类。我设置了resouceLookup的属性并测试了英文/中文的语言。它都导致错误“资源查找位置中没有名为 stopwords.ar 的资源......”。我写的鳕鱼:

有什么问题?谢谢。

0 投票
0 回答
271 浏览

python - 尝试将 XML 字符串发送到 Carrot2 服务器时出现 ParseError

当我将此请求发送到我的 Carrot2 服务器时:

我得到以下回复:

难道我做错了什么?我不确定要寻找什么来找到问题

编辑:我使用以下代码构建了 XML 字符串

0 投票
2 回答
1671 浏览

elasticsearch - Carrot2+ElasticSearch 基本信息流

我正在使用 Carrot2 和 ElasticSearch。当我安装carrot2插件时,我的弹性搜索服务器运行了大量数据。

想得到几个基本问​​题的答案:

  • 集群是否只适用于新索引的文档甚至旧文档?

  • 如何指定要查看哪些字段以进行聚类?

  • curl 命令正在运行并给出了一些结果。如何获取 curl 命令,该命令将 JSON 作为 localhost:9200/article-index/article/_search_with_clusters 形式的 REST API url 的输入?.....

感谢任何帮助。

0 投票
1 回答
115 浏览

eclipse - 无法将 Carrot2 导入 Eclipse

我想用 Carrot2 作为库来构建一个新软件。但是当我建立一个新项目时,没有“从现有源创建项目”。我可以知道如何使用 Carrot2 作为库吗?

谢谢!

0 投票
1 回答
366 浏览

carrot2 - Carrot2 分数、标签、短语和相似性?

我不太明白 Carrot2 中标签和短语之间的区别,而且它们似乎没有给出明确的区别我http://doc.carrot2.org/。我尝试将它们都打印出来,但它们显然是相同的(使用kmeansclustering)。有人可以帮我解决这个问题吗?

我也想知道分数。聚类后​​,我的集群没有附加任何分数,我应该自己计算这些吗?

关于相似度,是否可以使用 Carrot2 来确定查询与集群的相似程度?

0 投票
1 回答
53 浏览

carrot2 - 向量空间模型 Carrot2

对文档进行聚类后是否可以获得向量空间模型?

我在文档中看到,可以使用以下方法创建自己的向量空间模型:

预处理上下文将是:

使用我的文档列表,但那是在我对文档进行聚类之前。

我想要集群的向量空间模型。

最后的办法是自己创建它......

0 投票
1 回答
50 浏览

carrot2 - PDF 中的 Carrot2 指南

您能否说一下文档是否有 pdf(或 doc)版本?如果是,我在哪里可以找到它?

如果不存在这样的东西,我想创建这样的东西会很棒。PDF 允许在 Mendeley 桌面程序中阅读文件,在对我很重要的部分下划线并发表评论。与指南的 html 版本相比,这将是一个很大的优势。

0 投票
1 回答
160 浏览

eclipse - 用Java构建carrot2源代码

我正在尝试在 Eclipse 中编译 Carrot2 代码,但收到很多警告:

.apt_generated/ 源中缺少..

ETC

请问你有什么想法吗?

0 投票
1 回答
79 浏览

lucene - 使用 dcs 集群远程 lucene indec

我尝试使用远程服务器上的 lucene 索引作为安装在同一服务器上的胡萝卜 2 的输入。关于文档,carrot2-dcs 应该可以实现(文档第 3.4 章 Carrot2 文档集群服务器:包括各种文档来源。Carrot2 文档集群服务器可以从大量来源获取和集群文档,包括主要的搜索引擎和索引引擎(Lucene , 索尔))。

安装carrot2-dcs 3.9.3 后,我发现lucene 不能作为文档源。如何进行?