问题标签 [carrot2]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
algorithm - 如何在 Solr 管理控制台中指定使用 STC 算法?
我有一个在 Ubuntu 上使用 Carrot2 的测试 Solr 环境。使用 Carrot2 工作台,我可以在三种定义的算法(Lingo、STC、kmeans)之间切换。如何在 Solr 管理查询工具中做同样的事情?它是与聚类参数一起传递的参数吗?
所有 3 种算法都在 solrconfig.xml 中定义,它基本上是 collection1 中示例的副本。我推断它默认使用 Lingo,但如果我愿意,不确定在哪里将其切换到 STC。
k-means - Carrot2-bisectingKmeans设置resouceLookup的属性导致no resouces named stopwords.ar的错误
Carrot2-我尝试通过 bisectingKmeans 算法对文档进行聚类。我设置了resouceLookup的属性并测试了英文/中文的语言。它都导致错误“资源查找位置中没有名为 stopwords.ar 的资源......”。我写的鳕鱼:
有什么问题?谢谢。
python - 尝试将 XML 字符串发送到 Carrot2 服务器时出现 ParseError
当我将此请求发送到我的 Carrot2 服务器时:
我得到以下回复:
难道我做错了什么?我不确定要寻找什么来找到问题
编辑:我使用以下代码构建了 XML 字符串
elasticsearch - Carrot2+ElasticSearch 基本信息流
我正在使用 Carrot2 和 ElasticSearch。当我安装carrot2插件时,我的弹性搜索服务器运行了大量数据。
想得到几个基本问题的答案:
集群是否只适用于新索引的文档甚至旧文档?
如何指定要查看哪些字段以进行聚类?
curl 命令正在运行并给出了一些结果。如何获取 curl 命令,该命令将 JSON 作为 localhost:9200/article-index/article/_search_with_clusters 形式的 REST API url 的输入?.....
感谢任何帮助。
eclipse - 无法将 Carrot2 导入 Eclipse
我想用 Carrot2 作为库来构建一个新软件。但是当我建立一个新项目时,没有“从现有源创建项目”。我可以知道如何使用 Carrot2 作为库吗?
谢谢!
carrot2 - Carrot2 分数、标签、短语和相似性?
我不太明白 Carrot2 中标签和短语之间的区别,而且它们似乎没有给出明确的区别我http://doc.carrot2.org/。我尝试将它们都打印出来,但它们显然是相同的(使用kmeansclustering)。有人可以帮我解决这个问题吗?
我也想知道分数。聚类后,我的集群没有附加任何分数,我应该自己计算这些吗?
关于相似度,是否可以使用 Carrot2 来确定查询与集群的相似程度?
carrot2 - 向量空间模型 Carrot2
对文档进行聚类后是否可以获得向量空间模型?
我在文档中看到,可以使用以下方法创建自己的向量空间模型:
预处理上下文将是:
使用我的文档列表,但那是在我对文档进行聚类之前。
我想要集群的向量空间模型。
最后的办法是自己创建它......
carrot2 - PDF 中的 Carrot2 指南
您能否说一下文档是否有 pdf(或 doc)版本?如果是,我在哪里可以找到它?
如果不存在这样的东西,我想创建这样的东西会很棒。PDF 允许在 Mendeley 桌面程序中阅读文件,在对我很重要的部分下划线并发表评论。与指南的 html 版本相比,这将是一个很大的优势。
eclipse - 用Java构建carrot2源代码
我正在尝试在 Eclipse 中编译 Carrot2 代码,但收到很多警告:
.apt_generated/ 源中缺少..
ETC
请问你有什么想法吗?
lucene - 使用 dcs 集群远程 lucene indec
我尝试使用远程服务器上的 lucene 索引作为安装在同一服务器上的胡萝卜 2 的输入。关于文档,carrot2-dcs 应该可以实现(文档第 3.4 章 Carrot2 文档集群服务器:包括各种文档来源。Carrot2 文档集群服务器可以从大量来源获取和集群文档,包括主要的搜索引擎和索引引擎(Lucene , 索尔))。
安装carrot2-dcs 3.9.3 后,我发现lucene 不能作为文档源。如何进行?