问题标签 [lucidworks]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

58 问题

0 投票

0 回答

30 浏览

solr - 使用 solr 进行 Hbase 索引

我正在尝试使用 solr 索引 hbase 表。我已按照以下链接 https://community.cloudera.com/t5/Community-Articles/Hbase-indexing-to-Solr-with-HDP-Search/ta-p/244387中给出的步骤进行操作

但是 Solr admin 中的 numDocs 仍然为 0。
我的 Hbase 版本是 1.1.2，solR 版本是 6.6.2。
你有什么解决办法吗？

谢谢你。

2019-10-03T09:00:26.233

0 投票

1 回答

122 浏览

solr - 在 edismax 算法中如何计算太阳能中的分数？

在 edismax 算法中如何计算太阳能中的分数？我知道 qf、pf、pf2、pf3 和 mm。但我不知道用于获取查询分数的公式是什么（{！field f=query_s v=$q}）。我正在使用 LucidWorks，我添加了屏幕截图供您参考。我需要知道 qf、pf、pf2、pf3 在计算分数时做出贡献的确切公式或算法。带有适当示例的算法对我真的很有帮助。详细参数截图

solr lucidworks

2019-12-06T10:34:52.017

0 投票

1 回答

43 浏览

java - Lucidworks 自定义连接器获取最后工作时间

需要在自定义 java 连接器中获得最后一个成功的作业运行时。

是否可以获得上次运行开始值，或任何其他方式来存储和检索上次作业运行时间？

试图通过访问历史 API 服务来获取最后的工作时间。 curl -u user:pass fusion-host:6764/api/jobs/datasource:movies-db/history

有没有其他方法可以从连接器本身获取值？

java oracle lucidworks

2020-02-09T14:12:21.373

0 投票

0 回答

226 浏览

java - 码头线程线性增加

我有一个 apache FUSION 服务器并为它配置了码头。我可以看到使用 newrelic 线程数线性增加。一段时间后，这些线程增加到一个限制并导致内存不足异常，直到我重新启动代理服务器。

请在下面找到我为调节线程数所做的 start.ini 配置。

我也尝试添加启用线程的属性，但它没有用。谁能帮助我如何限制这些线程？对于其他服务器上的相同配置，我可以看到线程没有增加并且在 newrelic 上的范围很好。

java solr jetty newrelic lucidworks

2020-03-30T09:27:55.913

0 投票

0 回答

118 浏览

solr - 如何将 Solr 的并行 SQL 和 Streaming 表达式与驻留在多云环境中的集合一起使用

我们正在探索 Solr 中的流式表达式和并行 SQL，以便在我们当前的项目中使用。在我们的用例中，我们需要加入两个集合，一个位于私有数据中心，另一个位于公共云上。我正在阅读 Solr 的参考指南和来自 lucidworks的博客文章。使用驻留在同一 Solr 引擎上的集合演示了示例。

是否可以将并行 SQL 或流式表达式与位于不同环境中的集合一起使用？

我们使用 solr(7.x) 作为数据源之一的 spark，以及 lucidworks-spark-solr 3.4.5 连接器

solr apache-spark-sql solrcloud lucidworks

2020-07-06T03:54:49.327

0 投票

1 回答

36 浏览

filter - Lucene 标记化/过滤器未按预期工作 | Solr分析混乱

我试图在我的 Solr/Lucidworks 设置中找出我的分析仪配置的正确配置。

我在 Solr 分析中看到的结果似乎表明我应该得到匹配，但是当我执行 Solr 查询（本机或在 Lucidworks UI 中）时，没有返回任何结果。

架构中的相关片段是：

我已经索引了一些包含字符串的内容：

现在，当我使用 Solr 分析时，得到的结果如下：

我的理解是，如果突出显示任何结果，则表示匹配，但是当我在 Solr 中的“管理员”上进行搜索时，找不到任何结果：

如果我搜索：

我确实得到了预期的结果。

我完全想念分析工具应该如何工作的理解？

我想要实现的是一个支持很多技术项目的搜索索引，它只会匹配精确的值。例如：

V-123-1231-1231
WILL_NOT_CHANGE
/mnt/abc/驱动程序/
4040:5050

所以 WhitespaceTokenizer 似乎是最有意义的，但我还需要对非技术字符串进行词干处理，这些字符串将由句点 (.)、破折号 (-)、下划线 (_)、斜杠 (\ 或 /) 等表示。

任何见解/建议将不胜感激。

filter solr lucene tokenize lucidworks

2021-02-04T22:09:06.280

0 投票

1 回答

57 浏览

solr - 在 Lucidworks Fusion 4 中更改“Solr Cluster”

我正在使用外部 Zookeeper (3.5.6) 和 Solr (7.7.2) 运行 Fusion 4.2.4。我一直在运行一组本地服务器，并正在尝试迁移到 AWS 实例。我本地 Zookeeper 的所有配置都已复制到 AWS 实例，因此它们在功能上应该是等效的。

我已经到了要关闭旧的（本地）Zookeeper 实例并只使用在 AWS 中运行的实例的地步。我已更改 Solr 和 Fusion (fusion.properties) 的配置，以便它们仅使用 AWS 实例。

我遇到的问题是与我的所有收藏相关联的 Fusion 的 solr 集群（System->Solr Clusters）仍然设置为旧的 Zookeepers :9983,:9983,:9983 所以如果我关闭所有旧的 Zookeeper 实例通过 Fusion 的查询 API 进行的查询不再起作用。当我尝试更改该集群的“连接字符串”时，它会失败，因为该集群当前正在被集合使用。我能够创建一个新集群，但我看不到将新集群与我的任何集合相关联。在与生产环境类似的测试环境中，我使用 Fusion 的 Collections API 更改了特定集合的 searchClusterId，但是这样做之后，当我关闭所有“旧”Zookeeper 实例时，查询仍然失败。看来这是要走的路，所以我

到目前为止，Lucidworks 的支持还无法提供解决方案——我愿意接受建议。

solr apache-zookeeper fusion lucidworks

2021-06-01T11:15:55.657

0 投票

1 回答

75 浏览

java - ProducerBlockedQuotaExceededError：无法在超过积压配额的主题上创建生产者

我在AWS EKS上有一个Lucidworks Fusion 5 kubernetes安装设置，目前其中一项服务Connector Classic REST service出现中断。在深入研究日志后，我发现：

从这里我查看了pulsar-broker configmap 并发现：

我不太精通Apache Pulsar，但在我看来，如果我尝试提高此积压配额限制，它应该允许 连接器经典 REST 服务再次连接到代理，这应该使连接器经典 REST 服务恢复正常。这是一个公平的评价吗？

在不更改任何配置的情况下，是否有办法解决此问题（例如重新启动特定服务，...）？
解决此问题的最佳方法是什么？

提前致谢。

java solr apache-pulsar lucidworks

2022-01-07T18:09:15.333

1 2 3 4 5 6 7 8 9 10

问题标签 [lucidworks]

Reference