问题标签 [dih]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
solr - Solr 索引时间提升
我正在使用 DIH 将数据导入到 solr。在我的 schema.xml 中,我定义了所有字段。我知道有两种类型的提升技术,查询时间或索引时间。是否可以通过在索引期间为字段分配权重来提升字段。
例如,如果有 4 个字段 id、title、description 和关键字。然后,如果与关键字相比,搜索字符串在标题中,我想“提高”分数。
谢谢
mongodb - 使用 DataImportHandler 连接 MongoDB 和 Solr 的步骤
我是 SOLR 和 MONGODB 的新手。
我正在尝试使用 DataImportHandler 将 mongodb 中的数据索引到 SOLR 中,但我找不到需要遵循的确切步骤。
您能否帮助我获得使用 DataImportHandler 将 MongoDB 索引到 Solr 的确切步骤?
SolrVersion - solr-4.6.0
MongoDB 版本 - 2.2.7
solr - 为什么 Solr 数据导入处理程序对 uniqueKey 进行哈希处理?
Solr 4.6.0 有一个非常奇怪的问题。
uniqueKey 字段“id”包含每个文档的哈希值,而不是我的字符串值。如果在 Solr 管理员中仅使用更新请求处理程序添加一个自定义文档,我会得到例如我指定的 ID 值“book_45”,所以这是正确的。
但是,当我使用 DIH(数据导入处理程序)进行完全导入时,id 字段包含每个文档的哈希值,例如“[B@53bd370f”,而不是我的自定义值。所以问题一定出在DIH上。
我的导入脚本:
我的 schema.xml 中的 id 字段(与默认发布的核心 collection1 中的相同):
有谁知道我错过了什么?
solr - 在 SOLR 中设置字段值
是否可以在 SOLR 的 DIH 文件中设置字段的值?我不想检索数据库字段的值,而是想要一个计算值。
javascript - 我可以在 javascript 转换器中访问 solr dataimporter.request 变量吗
我有一个从 Oracle 数据库收集数据的 dataconfig.xml 文件。在 Datasource 元素中,我使用了 ${dataimporter.request.dbname} 等变量,它们成功返回了我通过 dataimport url 传递的自定义值。
我现在正在同一个 dataconfig 文件中编写一个 javascript 转换器,以在一个多值字段中添加值,其中包括数据库名称。是否可以从 javascript 转换器中引用变量 ${dataimporter.request.dbname} ?如果是这样,正确的语法是什么?
这是我尝试过的,但没有填充 dbname:
任何帮助是极大的赞赏!
提前致谢。
solr - 使用 Solr 和 DIH 在子实体中搜索相关字段
我想使用 SQLServer DB 中的 Solr (4.7.2) 和 DIH 索引和查询作者及其参考书目(父/子关系),我想查询哪些作者在 2005 年之后出版了一本书,标题包含“狼”这个词“, 例如。
配置文件是:
数据导入.xml
架构.xml
我认为使用这种配置,我失去了年份和标题之间的关系并显示交叉结果。
fq=year:[2005 TO *] AND title:wolf
此查询返回至少一本书在 2005 年之后的作者和一本标题为“狼”的书,但如果我想要在 2005 年之后出版一本书并包含“狼”的作者。
提前致谢
solr - SOLR 数据输入处理程序 (DIH):在索引期间提取电子邮件地址并放入另一个字段?
我有一个名为 main_text 的字段,其中包含一个大文本条目。
我想通过创建一个新集合来重新索引我的数据,但我想将此字段中的所有电子邮件地址提取到名为 emails_fields 的新特殊字段中。
最好的方法是什么?
使用什么处理程序?迪赫?其他 ?这个新字段应该是什么类型?
solr - SOLR DIH 多重查询
问题
SOLR DIH 总结每次迭代中的查询。就像在第三次迭代中一样,产生以下输出
数据配置文件
因此,当我在每次迭代中批量上传数据时,查询总结和性能滞后。目前我的服务器每秒处理 2 个文档。
我没有使用 SQL 实体,因此无法实现 cachedsqlentity 处理器。
类似问题
solr - 来自 DIH 的 Apache Solr 索引
我已经设置了 solr。我的 data-config.xml 如下所示
bsin 和 brand 是多值字段。现在每个 NAME 都有多个 BSIN,每个 BSIN 都有一个品牌名称。我希望索引应该以这种方式发生:
Name1-Brand1 Name1-Brand2 Name2-Brand1 等。我正在使用条款组件进行自动完成。请帮助我实现这一点。
提前感谢您的帮助。问候, 帕万
solr - Solr 完全导入有问题
我正在运行具有 5 个内核的 Sol 3.6 版本。每当我的应用程序启动时,我都会进行完全导入。我只是调用 http://:/solr//dataimport?command=full-import
截至目前,我面临2个奇怪的问题。
- 核心数据之一是空的(索引被删除)。不知道为什么。
- 在我的查询中,我已限制仅加载 6 个月大的数据。有时我会得到比 6 个月大得多的数据。
问题:默认的“clean = true”是什么意思?在我的情况下它是真的。这是否意味着一旦我执行以下查询我将看不到数据?http://:/solr//select/?q= %3A &version=2.2&start=0&rows=10&indent=on