问题标签 [carrot2]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
58 浏览

carrot2 - 当我创建一个本地 xml 文件时,导入 carrot2 时出错

我正在尝试创建一个本地 xml 文件以进行导入。https://doc.carrot2.org/#figure.input-xml-format中指定的标签给了我一个错误。具体来说,我得到了错误:

“无法从以下位置读取属性:/lungo/home/holz/nestlib/extras/text/carrot2/goodpubmed.xml 元素‘查询’在第 2 行的类 org.carrot2.util.attribute.AttributeValueSets 中不匹配”。

如果我删除查询,我会收到“文档”元素的错误。我刚刚下载了 1.8 的最新linux版本java

0 投票
1 回答
156 浏览

solr - Solr 与 Carrot2

我正在尝试将 Solr 与 Carrot2 集群引擎集成。我通过以下链接成功地通过 Solr 进行集群:结果集群我得到了与 techproducts 示例中提到的相同的输出。我无法通过胡萝卜可视化集群当我尝试将 Solr 作为源并处理它时。如果我尝试这样做,我会收到以下错误-

处理错误:javax.xml.transform.TransformerException:javax.xml.transform.TransformerException:com.sun.org.apache.xml.internal.utils.WrappedRuntimeException:prolog 中不允许内容。javax.xml.transform.TransformerException:javax.xml.transform.TransformerException:com.sun.org.apache.xml.internal.utils.WrappedRuntimeException:prolog 中不允许有内容。

如何纠正这个错误?

0 投票
1 回答
78 浏览

javascript - 必须提供返回 dcs.source 或 dcs.c2stream 中的非空文档列表的 Carrot2

我正在使用胡萝卜2s api:

如果我在邮递员中运行相同的请求,我会得到预期的结果。

我收到的错误是:

HTTP 状态 400 – 错误请求

必须提供 dcs.source 或 dcs.c2stream 中的非空文档列表

由于某些被认为是客户端错误(例如,格式错误的请求语法、无效的请求消息帧或欺骗性请求路由),服务器不能或不会处理请求。

0 投票
1 回答
193 浏览

solr - 修改停用词列表

我想调整胡萝卜2 集群以避免标签,这些标签不以介词开头——对于俄语来说,在语法案例(非主格)中看到一个单词并且没有介词看起来很奇怪。

集群是使用 Apache Solr 完成的。

例子:

我尝试了两个独立的东西:

  1. 配置 core/clustering/carrot2/stopwords.ru - 并从那里删除问题中的介词
  2. 解压缩carrot2-mini-3.9.0.jar,从stopwords.ru 中删除条目并重新打包到jar 中。

以上都对集群标签没有任何影响。还有其他明显的尝试吗?或者,也许,完全改变调整的方法?

谢谢!

0 投票
1 回答
79 浏览

solr - 胡萝卜:同一查询的不同集群

当使用匹配所有查询 (* : *) 发出相同的查询时,我总是得到不同的集群和分数。可能是什么原因?

第一次尝试:

第二次尝试:

第三次尝试:

集群内的文档 ID 也不同。集群本身发生变化:在一个查询响应中,我得到一个集群“тысячамиевро”,在随后的一个中它消失了,但出现了新集群:“Тысячами Долларов”

是否有一些胡萝卜参数可以使给定查询的集群稳定?可能是期望的ClusterCountBase 吗?

Solr 索引对于所有情况都是相同的。使用的算法:org.carrot2.clustering.lingo.LingoClusteringAlgorithm with StopWordLabelFilter.enabled=false 和 clustering.rows=1000。

0 投票
0 回答
211 浏览

solr - 胡萝卜2工作台和solr

我在 debian 上安装了 solr 7.3,并希望使用 carrot2 工作台 3.16.0 对结果进行聚类。我使用了carrot2手册第4.2.5章“从solr索引中聚类文档”和: - 将“solr”设置为源 - 在medium部分使用默认值 - 将服务url设置为:http://localhost:8983/solr/corename /select?wt=xml

我得到了结果,但只有一个没有聚类的纯空列表

在集群部分(carrot2 工作台中间窗口的左侧)我得到:其他主题(nn),没有别的;在文档部分(carrot2 工作台中间窗口的右侧)我得到:一个空列表 [0] 直到 [nn];

怎么了?

(服务网址:http://localhost:8983/solr/corename/select导致:“com.sun.org.apache.xml.internal.utils.WrappedRuntimeException: Content is not allowed in prolog”因为结果在 json )

0 投票
0 回答
44 浏览

solr - 向 Carrot2 WAR 文件添加身份验证

有没有办法使用 Carrot2 WAR 文件向 Solr 添加基本身份验证?

我们曾经使用本地 solr 实例运行 Carrot2,但现在我们将其移动到另一个仅在 Solr 上运行的 VM。

我在 source-solr-attributes.xml 上设置了 URL,就像这样:

<attribute key="SolrDocumentSource.serviceUrlBase"> <value type="java.lang.String" value="http://localhost:8983/solr/mycore/select?wt=xml"/> </attribute>

由于我们正在使用的版本上没有 java 代码,我如何/在哪里设置用户和登录以确保 Carrot 将使用它与 Solr 通信?

0 投票
1 回答
27 浏览

carrot2 - 为什么无法访问所有文档资源?

我想了解为什么我不能继续使用 Carrot2 工作。出现一条消息“我们很抱歉,出现以下处理错误:org.carrot2.source.etools.IpBannedException: org.apache.http.client.HttpResponseException: Forbidden” eTools、Wiki、PUT 文档源存在问题( 2019 年 7 月 31 日)进入在线版本。我尝试使用该程序的下载版本,但没有文件源不起作用。你能解决这个问题吗?需要多长时间?谢谢!

0 投票
1 回答
16 浏览

carrot2 - 将 TF-IDF 结果导入 Carrot2

我喜欢 Carrot2 的工作方式。我目前主要使用 XML 导入。我想用 TF-IDF 结果而不是片段导入 XML 文件。这将允许我按照我的意愿准备数据。

我试图在片段中传递 TF-IDF 关键字(没有指标)并且它以某种方式工作。不幸的是,Carrot2 再次对我的数据执行 TF-IDF,结果很平庸。如果我可以将关键字与重要性指标一起传递,然后仅使用 Carrot2 来微调结果,那就太好了。

我在 API 中搜索了这样的解决方案,但我找不到。有可能吗?

0 投票
1 回答
10 浏览

carrot2 - carott2 是否有用于 JIRA 集成的适配器,用于可视化 JIRA 票据收集

carott2 是否有用于 JIRA 集成的适配器,用于可视化 JIRA 票据收集?我试图弄清我们公司大量的门票。这些很可能属于少数可以从票证的文本内容中推断出来的类别。如果我可以将胡萝卜2 指向 JIRA 服务并获得票证的泡沫树可视化,那就太好了。