问题标签 [dih]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
solr - Solr - DataImportHandler 清理参数不起作用
Solr 3.2 根据 doc clean 参数默认为 true (clean=true,commit=true,optimize=true)。
我有2个核心
- 一旦触发完全导入,core-1 索引就会被删除
- 对于 core-2 索引,一旦完全导入完成,就会被删除。
为什么行为有所不同?以前有人遇到过这个问题吗?
xml - 序言中不允许 Solr DIH 和 SAXParseException 内容
我是 Solr 的新手,并尝试使用 Solr 的 DIH 索引文件系统。有趣的是,它工作得很好——有一段时间。现在 DIH 不会初始化并且我不断收到 SAXParseException: Content is not allowed in prolog。
有任何想法吗?我在 Debian 上使用 Solr 3.6.0。我用十六进制编辑器检查了配置文件,但什么也没找到。
这是 data-config.xml:
和错误:
solr - 嗨,我想要使用 filelistentityprocessor 和 lineentityprocessor 的文件名
我正在使用 solr4.4 来索引数百万个文档。我也希望对文件名和修改时间进行索引。但找不到方法来做到这一点。在 data-config.xml 中,我使用 filelistentityprocessor 获取文件,然后使用 lineentityprocessor 解析每一行。
mysql - SOLR DIH 在同一个 MySql 表上添加具有多个查询的文档
我是 Solr 中的菜鸟,我陷入了一种情况,我想完全导入到同一文档实体,使用基于 Solr DIH 的不同条件在 SAME 表上使用多个查询。那么可以实现吗?
我的问题(我想做什么):
比如说,我想像这样定义我的数据导入模式,使用来自的数据索引实体,TABLE A
根据不同的条件多次,下面的格式可能吗?
关于更多问题:如何variables
在 SOLR 数据导入配置文件中设置 MYSql 自定义?
例如,
SET @USerID = 0;
谢谢 。
solr - 如何在 Solr DiH 中使用聚合函数?
我有一个要求,列值的聚合必须进入 Solr 文档字段。
Oracle 支持listagg和类似的功能。
在 DiH 中使用时会引发错误,例如
不允许子分组
oracle sql查询是
上面的查询在一行中给出了给定主题的学生和他们的排名。
具有最佳性能的 DIH 中最聪明的方法是什么。
有什么建议么?
solr - 文件系统数据源的 DataImportHandler DIH
我有一个 fileSystem 数据源,并且我已经创建了一个 dataconfig 来运行 DIH,dataconfig 是
当我运行 DIH 时,它会
完成索引。添加/更新:0 个文档。删除了 0 个文档。
请求:0,获取:35924,跳过:0,处理:0
知道为什么它没有处理任何文件吗?
xml - SOLR 使用 XPathEntityProcessor 支持 DIH 中的父子关系
SOLR DIH 似乎在 SQL 实体处理器中增加了对父子关系(块连接)的支持,但 xml 实体处理器似乎缺少同样的功能。我的情况是这样的:不同日期范围的报价会有所不同。所以我试图将其表示为父子,如下所示:
我可以为此使用 /update REST,但我的文档文件的大小将在 1Gb 左右,所以要避免它。有没有另一种方法可以使用 DIH 来实现?
xml - Solr:使用 DataImportHandler 进行 XML 导入和 XSLT 处理
我在配置 Solr 4.10.3 DIH 以导入 XML 文件时遇到严重问题。尝试了几个小时,但没有运气。这是我的配置:
XSLT“solr.xls”将 XML 文件转换为 Solr 导入格式,因此我设置了 useSolrAddSchema="true"。但是,当我尝试从浏览器管理控制台运行此数据导入时,我不断收到错误消息:
这里有几件事我不清楚:
- 错误消息它没有说明它正在寻找哪个文件。
- 为什么在查找目录时提示“找不到文件”?
- 如果我正确理解了 dataSource 的“basePath”属性,这将是解析实体元素中给出的相对路径的基础。因此,baseDir“/import”将被解析为“/path/to/my/cores/root/myCoreName/import”。但这似乎没有正确发生。
- 我将如何配置路径以使用 solr root 的相对路径而不是绝对路径?
也许有人可以向我指出一些使用 XSLT 和 DIH 导入 XML 的工作示例。我想坚持使用 XSLT,因为它已经在工作了(我之前使用 Simple Post Tool 测试过导入)。
干杯,
马丁
solr - Solr MailEntityProcessor DIH 配置不断加载
我正在尝试从 Microsoft Exchange 索引我的电子邮件。服务器正在使用 IMAP4 协议。我在 solrconfig.xml 中添加了 requestHandler:
data-config.xml 包含以下内容:
问题是当我进入 Solr Admin UI-> 选择核心 (collection1)->dataimport 时,当我单击打开配置的 [+] 符号时,我收到“正在加载...”消息并且它一直在加载.
我在 data-config.xml 中尝试了不同的选项(folders="inbox" 和 protocol="imap"、protocol="pop"、protocol="pop3" 等),但没有任何效果。
可能是什么问题呢?
编辑: 截图:http: //i.stack.imgur.com/brnml.jpg
java - SOLR FULL IMPORT ERROR, unknown character set
I am facing this error while full importing via DIH solr 4.10.1 and tomcat8, also Iam using 'mysql-connector-java-5.1.30.jar' connector, and my MySql version is 5.6.20,
My dih config is making connection with ,
PS :all my tables are utf8 encoded
MY ERROR LOG in SOLR