问题标签 [lucidworks]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
30 浏览

solr - 使用 solr 进行 Hbase 索引

我正在尝试使用 solr 索引 hbase 表。我已按照以下链接 https://community.cloudera.com/t5/Community-Articles/Hbase-indexing-to-Solr-with-HDP-Search/ta-p/244387中给出的步骤进行操作

但是 Solr admin 中的 numDocs 仍然为 0。
我的 Hbase 版本是 1.1.2,solR 版本是 6.6.2。
你有什么解决办法吗?

谢谢你。

0 投票
1 回答
122 浏览

solr - 在 edismax 算法中如何计算太阳能中的分数?

在 edismax 算法中如何计算太阳能中的分数?我知道 qf、pf、pf2、pf3 和 mm。但我不知道用于获取查询分数的公式是什么({!field f=query_s v=$q})。我正在使用 LucidWorks,我添加了屏幕截图供您参考。我需要知道 qf、pf、pf2、pf3 在计算分数时做出贡献的确切公式或算法。带有适当示例的算法对我真的很有帮助。 详细参数截图

0 投票
1 回答
43 浏览

java - Lucidworks 自定义连接器获取最后工作时间

需要在自定义 java 连接器中获得最后一个成功的作业运行时。

在此处输入图像描述

是否可以获得上次运行开始值,或任何其他方式来存储和检索上次作业运行时间?

试图通过访问历史 API 服务来获取最后的工作时间。 curl -u user:pass fusion-host:6764/api/jobs/datasource:movies-db/history

有没有其他方法可以从连接器本身获取值?

0 投票
0 回答
226 浏览

java - 码头线程线性增加

我有一个 apache FUSION 服务器并为它配置了码头。我可以看到使用 newrelic 线程数线性增加。一段时间后,这些线程增加到一个限制并导致内存不足异常,直到我重新启动代理服务器。

在此处输入图像描述

请在下面找到我为调节线程数所做的 start.ini 配置。

我也尝试添加启用线程的属性,但它没有用。谁能帮助我如何限制这些线程?对于其他服务器上的相同配置,我可以看到线程没有增加并且在 newrelic 上的范围很好。

0 投票
0 回答
118 浏览

solr - 如何将 Solr 的并行 SQL 和 Streaming 表达式与驻留在多云环境中的集合一起使用

我们正在探索 Solr 中的流式表达式和并行 SQL,以便在我们当前的项目中使用。在我们的用例中,我们需要加入两个集合,一个位于私有数据中心,另一个位于公共云上。我正在阅读 Solr 的参考指南和来自lucidworks的博客文章。使用驻留在同一 Solr 引擎上的集合演示了示例。

是否可以将并行 SQL 或流式表达式与位于不同环境中的集合一起使用?

我们使用 solr(7.x) 作为数据源之一的 spark,以及 lucidworks-spark-solr 3.4.5 连接器

0 投票
1 回答
36 浏览

filter - Lucene 标记化/过滤器未按预期工作 | Solr分析混乱

我试图在我的 Solr/Lucidworks 设置中找出我的分析仪配置的正确配置。

我在 Solr 分析中看到的结果似乎表明我应该得到匹配,但是当我执行 Solr 查询(本机或在 Lucidworks UI 中)时,没有返回任何结果。

架构中的相关片段是:

我已经索引了一些包含字符串的内容:

现在,当我使用 Solr 分析时,得到的结果如下:

在此处输入图像描述

我的理解是,如果突出显示任何结果,则表示匹配,但是当我在 Solr 中的“管理员”上进行搜索时,找不到任何结果:

在此处输入图像描述

如果我搜索:

我确实得到了预期的结果。

我完全想念分析工具应该如何工作的理解?

我想要实现的是一个支持很多技术项目的搜索索引,它只会匹配精确的值。例如:

  • V-123-1231-1231
  • WILL_NOT_CHANGE
  • /mnt/abc/驱动程序/
  • 4040:5050

所以 WhitespaceTokenizer 似乎是最有意义的,但我还需要对非技术字符串进行词干处理,这些字符串将由句点 (.)、破折号 (-)、下划线 (_)、斜杠 (\ 或 /) 等表示。

任何见解/建议将不胜感激。

0 投票
1 回答
57 浏览

solr - 在 Lucidworks Fusion 4 中更改“Solr Cluster”

我正在使用外部 Zookeeper (3.5.6) 和 Solr (7.7.2) 运行 Fusion 4.2.4。我一直在运行一组本地服务器,并正在尝试迁移到 AWS 实例。我本地 Zookeeper 的所有配置都已复制到 AWS 实例,因此它们在功能上应该是等效的。

我已经到了要关闭旧的(本地)Zookeeper 实例并只使用在 AWS 中运行的实例的地步。我已更改 Solr 和 Fusion (fusion.properties) 的配置,以便它们仅使用 AWS 实例。

我遇到的问题是与我的所有收藏相关联的 Fusion 的 solr 集群(System->Solr Clusters)仍然设置为旧的 Zookeepers :9983,:9983,:9983 所以如果我关闭所有旧的 Zookeeper 实例通过 Fusion 的查询 API 进行的查询不再起作用。当我尝试更改该集群的“连接字符串”时,它会失败,因为该集群当前正在被集合使用。我能够创建一个新集群,但我看不到将新集群与我的任何集合相关联。在与生产环境类似的测试环境中,我使用 Fusion 的 Collections API 更改了特定集合的 searchClusterId,但是这样做之后,当我关闭所有“旧”Zookeeper 实例时,查询仍然失败。看来这是要走的路,所以我

到目前为止,Lucidworks 的支持还无法提供解决方案——我愿意接受建议。

0 投票
1 回答
75 浏览

java - ProducerBlockedQuotaExceededError:无法在超过积压配额的主题上创建生产者

我在AWS EKS上有一个Lucidworks Fusion 5 kubernetes安装设置,目前其中一项服务Connector Classic REST service出现中断。在深入研究日志后,我发现:

从这里我查看了pulsar-broker configmap 并发现:

我不太精通Apache Pulsar,但在我看来,如果我尝试提高此积压配额限制,它应该允许 连接器经典 REST 服务再次连接到代理,这应该使连接器经典 REST 服务恢复正常。这是一个公平的评价吗?

  • 在不更改任何配置的情况下,是否有办法解决此问题(例如重新启动特定服务,...)?
  • 解决此问题的最佳方法是什么?

提前致谢。