问题标签 [carrot2]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - 如何在此代码中修复 System.TypeInitializationException
我对一些代码有疑问:
}
它产生以下错误:
System.TypeInitializationException
“Examples.NET.SampleDocumentData”的类型初始化程序引发了异常。
如何解决这个问题?
cluster-analysis - 使用 weka 进行聚类
我保存了 100 个结果的谷歌查询(标题和描述)。它有这种格式:
你有个主意。我成功地将这个 CSV 文件加载到 weka 中。首先应用 NominalToString 过滤器(因为它在 Nominal 中加载)。然后使用以下选项应用 StringToWordVector:
或多或少。然后我得到一个单词列表,有时我使用 NGramTokenizer 至少有 3 个单词。
之后我去集群并选择K-means。这不是很好,因为它将 90% 放在一个集群中。或者也许是对的......
当我选择在此处使用训练集时会发生什么,因为我还没有任何东西?我应该使用什么选项?我想在类别(旅游、体育、经济……)中形成集群。Weka 能像 Carrot2 那样做吗?或者至少形成集群。
谢谢。
java - 无法在 Kubuntu 14.04 中运行 carrot2 工作台 3.10.2
我有 Java 1.7.0 ...
和 Ubuntu 14.04.2 LTS,运行 KDE (Kubuntu)。当我跑步时,./carrot2-workbench-ubuntu
我得到...
之后,我得到一个弹出窗口,上面写着以下内容:
有人可以帮我破译出什么问题吗?谢谢。
carrot2 - 在哪里可以找到 Carrot2 C# API?
我一直在尝试在 C# 项目中使用 Carrot2(集群引擎)。他们声明他们提供 C# API,但下载链接 [1] 已损坏(404 - 未找到)。他们的支持页面[2] 建议就 SO 提出问题,所以我想我会在这里发帖。
任何人都有关于 Carrot2 的官方或任何其他非官方 C# API 的信息?
[1] http://project.carrot2.org/download.html和http://download.carrot2.org/head/manual/index.html#section.integration.compiling-csharp-program-with-carrot2
api - 胡萝卜2 api不支持日语
我正在尝试使用carrot2 API 来聚集日语文档。它抛出这个警告:
org.carrot2.text.linguistic.DefaultTokenizerFactory:日语 (ja) 的分词器不可用。这可能会降低日语内容的聚类质量。
因此,集群过程失败,所有文档都属于“其他主题”集群。
有什么帮助可以解决这个问题吗?
提前致谢。
apache - solr 层次聚类
我正在尝试在 Apache SOLR 中启用分层集群(子集群生成)。为此,我使用 SOLR 聚类组件,将“outputSubclusters”参数设置为 true。
但是,当我以 JSON 格式显示输出时,我从集群过程中收到的对象没有显示任何子集群,这让我想知道......我在这里遗漏了什么?
这是我在 solrconfig.xml 中的集群组件:
和请求处理程序:
我真的一无所知,在此先感谢您的支持。
windows-8 - 无法在 Windows(8 和 10)上运行 Carrot2 工作台 3.11.0
已安装 Java(版本 8)。我的朋友在这个问题上寻求帮助,但我找不到任何答案。如果有人知道如何运行这个程序,请告诉我。
Windows 8 - 64 位架构,Windows 10 - 32 位。
PS对不起,我的语言(=
solr - Solr 6 和 carrot2 集成
我正在尝试在我的 Solr 6 安装中使用carrot2,但是在调用查询时我得到的只是:
java.lang.NoClassDefFoundError: com/carrotsearch/hppc/ObjectHashSet
06:04:55 solr.1 | at org.carrot2.text.preprocessing.PreprocessingContext.<init>(PreprocessingContext.java:53)
06:04:55 solr.1 | at org.carrot2.text.preprocessing.pipeline.CompletePreprocessingPipeline.preprocess(CompletePreprocessingPipeline.java:65)
06:04:55 solr.1 | at org.carrot2.clustering.lingo.LingoClusteringAlgorithm.cluster(LingoClusteringAlgorithm.java:191)
06:04:55 solr.1 | at org.carrot2.clustering.lingo.LingoClusteringAlgorithm.access$000(LingoClusteringAlgorithm.java:63)
06:04:55 solr.1 | at org.carrot2.clustering.lingo.LingoClusteringAlgorithm$1.process(LingoClusteringAlgorithm.java:177)
我已经尝试下载最新的 carrot2 并添加:
<lib dir=".../carrot2-workbench-3.12.0/plugins/" regex=".*\.jar" />
罐子在哪里com.carrotsearch.hppc
,但它没有改变任何东西。
任何有关如何使其工作的帮助将不胜感激。
carrot2 - 如何部署使用 lucene 索引对我自己的数据进行聚类的胡萝卜 2 网络应用程序
当我使用胡萝卜 2 网络应用程序将我自己的数据与 lucene 索引进行聚类时,我发现结果与我的预期不同。
错误一: [在右边的结果列表中只列出了集群文件名,没有匹配的文本段落和文件位置,我不确定是什么导致的问题,我猜可能是我使用lucene创建索引文件格式时错了,还是我的配置carrot2 web-app项目有问题,希望有人能告诉我答案][抱歉我的图片不能po,你可以看图二。]
错误二: 我发现我的搜索结果显示“其他主题”不仅仅是一个特定的主题,它困扰着我。我认为可能是聚类算法有问题或者是我提供的测试数据主题太少的原因。
当我使用K-means聚类算法时,结果出来了很多主题,但没有具体的主题名称,只有文件名。
如果有人可以回答我的疑问,我将不胜感激,您的回答会有所帮助。
这是我创建 lucene 索引文件的代码:
这是我的索引 PDF 文件代码(其中的一部分):
windows - Carrot2 首次使用时的问题
我已经下载了 Carrot2 并尝试了,我收到了响应“我们很抱歉,出现以下处理错误:org.carrot2.source.etools.IpBannedException: org.apache.http.client.HttpResponseException: Forbidden”
我读过这不是问题,因为允许的搜索数量是有限的。但这是我的第一次搜索!
(请原谅我的英语不好,我不会说英语)。
拉奎尔