问题标签 [dih]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
742 浏览

solr - Solr 索引时间提升

我正在使用 DIH 将数据导入到 solr。在我的 schema.xml 中,我定义了所有字段。我知道有两种类型的提升技术,查询时间或索引时间。是否可以通过在索引期间为字段分配权重来提升字段。

例如,如果有 4 个字段 id、title、description 和关键字。然后,如果与关键字相比,搜索字符串在标题中,我想“提高”分数。

谢谢

0 投票
3 回答
9219 浏览

mongodb - 使用 DataImportHandler 连接 MongoDB 和 Solr 的步骤

我是 SOLR 和 MONGODB 的新手。

我正在尝试使用 DataImportHandler 将 mongodb 中的数据索引到 SOLR 中,但我找不到需要遵循的确切步骤。

您能否帮助我获得使用 DataImportHandler 将 MongoDB 索引到 Solr 的确切步骤?

SolrVersion - solr-4.6.0

MongoDB 版本 - 2.2.7

0 投票
1 回答
282 浏览

solr - 为什么 Solr 数据导入处理程序对 uniqueKey 进行哈希处理?

Solr 4.6.0 有一个非常奇怪的问题。

uniqueKey 字段“id”包含每个文档的哈希值,而不是我的字符串值。如果在 Solr 管理员中仅使用更新请求处理程序添加一个自定义文档,我会得到例如我指定的 ID 值“book_45”,所以这是正确的。

但是,当我使用 DIH(数据导入处理程序)进行完全导入时,id 字段包含每个文档的哈希值,例如“[B@53bd370f”,而不是我的自定义值。所以问题一定出在DIH上。

我的导入脚本:

我的 schema.xml 中的 id 字段(与默认发布的核心 collection1 中的相同):

有谁知道我错过了什么?

0 投票
1 回答
74 浏览

solr - 在 SOLR 中设置字段值

是否可以在 SOLR 的 DIH 文件中设置字段的值?我不想检索数据库字段的值,而是想要一个计算值。

0 投票
2 回答
873 浏览

javascript - 我可以在 javascript 转换器中访问 solr dataimporter.request 变量吗

我有一个从 Oracle 数据库收集数据的 dataconfig.xml 文件。在 Datasource 元素中,我使用了 ${dataimporter.request.dbname} 等变量,它们成功返回了我通过 dataimport url 传递的自定义值。

我现在正在同一个 dataconfig 文件中编写一个 javascript 转换器,以在一个多值字段中添加值,其中包括数据库名称。是否可以从 javascript 转换器中引用变量 ${dataimporter.request.dbname} ?如果是这样,正确的语法是什么?

这是我尝试过的,但没有填充 dbname:

任何帮助是极大的赞赏!

提前致谢。

0 投票
1 回答
644 浏览

solr - 使用 Solr 和 DIH 在子实体中搜索相关字段

我想使用 SQLServer DB 中的 Solr (4.7.2) 和 DIH 索引和查询作者及其参考书目(父/子关系),我想查询哪些作者在 2005 年之后出版了一本书,标题包含“狼”这个词“, 例如。

配置文件是:

数据导入.xml

架构.xml

我认为使用这种配置,我失去了年份和标题之间的关系并显示交叉结果。

fq=year:[2005 TO *] AND title:wolf

此查询返回至少一本书在 2005 年之后的作者和一本标题为“狼”的书,但如果我想要在 2005 年之后出版一本书并包含“狼”的作者。

提前致谢

0 投票
1 回答
194 浏览

solr - SOLR 数据输入处理程序 (DIH):在索引期间提取电子邮件地址并放入另一个字段?

我有一个名为 main_text 的字段,其中包含一个大文本条目。

我想通过创建一个新集合来重新索引我的数据,但我想将此字段中的所有电子邮件地址提取到名为 emails_fields 的新特殊字段中。

最好的方法是什么?

使用什么处理程序?迪赫?其他 ?这个新字段应该是什么类型?

0 投票
0 回答
653 浏览

solr - SOLR DIH 多重查询

问题

SOLR DIH 总结每次迭代中的查询。就像在第三次迭代中一样,产生以下输出

数据配置文件

因此,当我在每次迭代中批量上传数据时,查询总结和性能滞后。目前我的服务器每秒处理 2 个文档。

我没有使用 SQL 实体,因此无法实现 cachedsqlentity 处理器。

类似问题

solr-dih 对子实体进行多次查询

0 投票
1 回答
77 浏览

solr - 来自 DIH 的 Apache Solr 索引

我已经设置了 solr。我的 data-config.xml 如下所示

bsin 和 brand 是多值字段。现在每个 NAME 都有多个 BSIN,每个 BSIN 都有一个品牌名称。我希望索引应该以这种方式发生:

Name1-Brand1 Name1-Brand2 Name2-Brand1 等。我正在使用条款组件进行自动完成。请帮助我实现这一点。

提前感谢您的帮助。问候, 帕万

0 投票
1 回答
1186 浏览

solr - Solr 完全导入有问题

我正在运行具有 5 个内核的 Sol 3.6 版本。每当我的应用程序启动时,我都会进行完全导入。我只是调用 http://:/solr//dataimport?command=full-import

截至目前,我面临2个奇怪的问题。

  1. 核心数据之一是空的(索引被删除)。不知道为什么。
  2. 在我的查询中,我已限制仅加载 6 个月大的数据。有时我会得到比 6 个月大得多的数据。

问题:默认的“clean = true”是什么意思?在我的情况下它是真的。这是否意味着一旦我执行以下查询我将看不到数据?http://:/solr//select/?q= %3A &version=2.2&start=0&rows=10&indent=on