问题标签 [carrot2]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
56 浏览

carrot2 - 如何让 Carrot2 保存基本查询?

在 Carrot2 (3.12.0.0) 的搜索小部件中,您可以选择磁盘图标并执行“另存为...”。这保存了 Search 小部件的所有属性(在我们的例子中,我们使用 Solr,所以它是所有 Solr 字段),但它不保存 Basic Query 字段(小部件中唯一的必填字段)。在下图中,所有黄色突出显示的字段都被保存,但没有被圈出的“查询(必填)”字段。

我已经从 Git ( http://project.carrot2.org/source-code.html ) 下载了源代码,但我不知道如何更新代码来保存这个值,甚至不明白为什么它不是t 默认保存。

任何帮助将不胜感激。

在此处输入图像描述

0 投票
1 回答
126 浏览

xml - 在carrot2 xml 文件中将什么指定为URL?

我有一组文件(多行句子文本)。我想用胡萝卜2对它们进行聚类。根据文档中指定的xml文件格式。必须有一个带有片段、url 和标题的查询和文档。

我的问题如下: -

  1. XML文件的查询组件应该写什么??
  2. 应该给出什么作为文档的 URL 和标题,因为我没有它们。我只有从数据集中提取的文档(多行文本)。

我认为第一个问题的答案是*:*。那是对的吗??请帮忙!!

编辑:-

java.lang.NullPointerException在指定 xml 文件并按下过程后,carrot2-wordbench 会抛出错误。

我确信错误是由于 xml 文件作为输入给出的。

有谁知道可能导致程序抛出异常的 xml 错误?

很长时间以来,我一直无法弄清楚这一点。

0 投票
1 回答
91 浏览

java - 我无法在win 8上安装carrot2

我想在文件“carrot2-workbench-win32.win32.x86_64-3.10.1”中安装 Carrot2 工作台,但它总是显示“这个应用程序无法在这台电脑上运行”。我通过下载“carrot2-release-3.13.0”搜索了新的工作台,但新的工作台不存在。

我使用 Windows 8、32 位操作系统。我不知道我的 Java 位是否与我的位操作系统相同,那么如何检查 JRE 位(java 运行时环境)?

以及如何解决这个安装问题?

0 投票
0 回答
39 浏览

django - 带有 Solr 聚类组件的 Haystack (carrot2)

我已将 Solr 配置为执行 carrot2 的 STC 集群组件(Solr 6),并且可以通过 Solr 的 Web 界面使用 requestHandler=/clustering 访问结果。但是,我们使用 Haystack/Django (1.10) 来访问 Solr,我在网上找不到任何表明 Haystack 对此支持的信息。可能吗?如果是这样,怎么做?

0 投票
1 回答
142 浏览

java - 如何执行 Carrot2 文档集群服务器

我下载了适用于 Mac 的 Carrot2 Document 集群服务器 build 3.15.0。自述文件说:

DCS 需要 Java 运行时环境 (JRE) 1.7.0 或更高版本。要运行 DCS,请执行“dcs”脚本并将浏览器指向 http://localhost:8080以获取更多说明。

Mac OS Sierra 并不容易,但我安装了 1.8.0_112。

问题是我不知道如何执行“dcs”脚本。

有 .cmd、.sh、.war 和 .jar 文件。我不确定要与哪一个一起工作。我认为.jar看起来很有希望,所以我关注了一些这个线程并在终端窗口中尝试了这个:

我 cd-ed 到了正确的目录,但它只是说Provide main class,但我不确定那是什么或在哪里。

任何人都可以提供有关如何执行此操作的说明或链接吗?

0 投票
1 回答
44 浏览

solr - 使用 Carrot2 DCS 实现增量聚类

Carrot2 接受 XML 输入,这些输入包括来自它自己对一些其他文档的导出的“集群”。现在,如果我想实现增量聚类,即引入新文档,连同以前的集群,我也必须在输入中保留旧文档。这使得输入随着我们的进步线性增长。

有没有办法提取集群以及各个集群的文档特征,以解决这个增量/在线集群问题?

0 投票
1 回答
77 浏览

carrot2 - 如何从 Carrot2 工作台导出集群名称和值?

我刚开始使用 Carrot2 Workbench 对搜索引擎结果进行聚类。可视化效果很好,但我希望导出集群列表及其文档数。此外,我对可能导出与集群相关的属性(例如权重)感兴趣。

我没有在工作台的界面上看到任何东西,但是有没有一种方法可以使用工作台,然后使用额外的代码片段导出?

任何帮助表示赞赏。我一直在寻找一段时间,到目前为止还没有看到任何答案。

问候,

安德鲁

0 投票
1 回答
159 浏览

windows-7 - 在 Windows7、8 或 10 上安装 Carrot2

我正在尝试在 32 位 Windows 7 上安装 carrot2-workbench-win32.win32.x86_64-3.15.1。我收到错误消息“此文件的版本与您正在运行的 Windows 版本不兼容”。

错误弹窗

我已经安装了 JDK8 并且运行良好。

有什么建议么?我需要重新编译吗?

0 投票
1 回答
110 浏览

solr - 用于本地索引的胡萝卜2 和 solr

我已经用 solr 6.5 和 data_driven_schema_configs 架构索引了一个本地文件夹我已经安装了胡萝卜2 web 3.15 和胡萝卜工作台

没关系:一切正常

我想打开文件列表结果中的任何一个文件......当我使用工作台(在 linux ubuntu 14.04 上)时,我获得了一个格式良好的 url,如“file:///mnt/xxx/yyy.pdf”,但 openlink 没有工作(没有任何东西是开放的)

当我使用carrot2 web(在linux ubuntu 14.04上)时,我得到了一个格式错误的url,比如“ http://localhost:8080/mnt/xxx/yyy.pdf ”(使用firefox 52.0)

有没有在这种情况下打开文件的解决方案?

问候弗雷德

0 投票
1 回答
136 浏览

solr - solr 聚类组件是如何工作的?

我正在寻找(正在制作我自己的)solr 的胡萝卜2 的默认聚类组件。在聚类组件类中,有 2 种方法调用聚类算法:

  • 在覆盖过程方法中

    /li>
  • 再次在 finishStage 方法中

    /li>

现在我的问题是 process 方法不是在完整的结果查询上工作,而是在所有结果都聚合后的分片和完成阶段 os 上工作,那么为什么我们两次调用聚类算法并将其添加到结果状态?我错过了吗?某物?

集群组件代码在这里

PS如果我错了请纠正我。