问题标签 [solr4]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
20606 浏览

solr - 重新加载 SolrCloud 配置(存储在 Zookeeper 上) - schema.xml

我已经使用独立的 zookeeper 设置了 SolrCloud 复制。但现在我希望对我的 Schema.xml 进行一些更改并重新加载核心。问题是,当我运行单个服务器 Solr(没有 solrcloud)时,会加载新模式,但我不知道如何在所有复制服务器上重新加载模式。我尝试在其中一台服务器上重新加载架构,但没有任何预期的影响。有没有一种方法可以在使用 Zookeeper 的分布式复制设置中重新加载 Solr 中的 schema.xml。

0 投票
0 回答
242 浏览

solr - 将突出显示的片段与相应的文档合并

在使用突出显示时,我们在 2 个部分中获得输出。

是否可以在文档内的字段中使用“em”标签?例如,如果查询是针对“引擎”的,我应该得到类似 -

如果上述事情是不可能的,是否可以在文档内突出显示文档 id xyz 的输出以及其他字段,例如 -

如果通过简单的配置更改和默认突出显示这是不可能的,是否可以使用自定义突出显示模块(通过扩展默认突出显示等)。

我目前正在使用 solr 3.4,但请告诉我是否可以在 3.4 之后的 solr 版本中使用

0 投票
1 回答
790 浏览

solr - Solr 排序无法正常工作

我正在使用此示例查询按类别对结果集进行分组:

这按预期工作,我得到了这个示例响应:

但是,我找不到按每个组具有的文档数(“numFound 字段”)指定组排序顺序的方法。我认为“排序”参数与它有关,但我不知道如何使用它。

0 投票
0 回答
1524 浏览

solr - Solr 4.2 EmbeddedSolrServer 无法加载现有索引数据

我正在扩展 Solr 的AbstractSolrTestCase以进行单元测试。

我有现有的“schema.xml”、“solrconfig.xml”和索引数据。我可以启动一个嵌入式 solr 服务器来加载现有的集合及其数据。然后在 solr 中测试搜索文档。

这些测试文件(solr conf 和数据索引)仍然适用于 Solr 4.2。我可以在命令行中启动 solr 服务器,并通过管理页面成功查询文档。

java -Dsolr.solr.home=/somewhere/testdata/solr -jar start.jar

然而,这种方式在适应 Solr 4.2.1 后不再起作用。经过一番调查,我发现 solr 的 EmbeddedSolrServer 似乎没有加载索引数据。

有人知道如何让 EmbeddedSolrServer 加载现有的索引数据吗?

我正在使用下面的代码来创建用于单元测试的嵌入式服务器。在下面的代码中,我使用了来自 solr 官方示例的索引数据。

0 投票
1 回答
931 浏览

apache - 当一个 URL 的 HTML 结构未知时,如何控制 Nutch 解析和 Solr 索引的方式?

我正在尝试抓取一些 HTML 结构维护不善的网站,我无法控制它来更改它。当我查看由 Solr 索引的 nutch 爬取数据时,“标题”字段看起来不错,因为“内容”字段包含大量垃圾,因为它使用下拉菜单从 html 横幅中抓取所有文本并向下处理左侧菜单、导航、页脚等。

就我而言,我有兴趣将 HTML 页面上的段落中定义的“描述:”信息抓取到“内容”字段中。

示例:(原始 html):

如何将垃圾从“内容”字段中过滤出来,并且只有我感兴趣的信息?

0 投票
1 回答
197 浏览

solr - Solr完全刷新而不删除索引

我想在不删除索引的情况下进行 solr 完全刷新,以便在完全刷新完成之前可以访问数据。完全刷新完成后,必须删除旧索引。我该怎么做,请帮忙。

0 投票
1 回答
130 浏览

solr - Solr 查询以返回按“在集合中查找”排序的结果

这是问题所在。

我有一个这样的 solr 查询:

例子:

我想订购它们,因为它们在查询中。

相当于这个的Mysql是:

我正在查看 Solr 排序文档、谷歌搜索等,但什么也没有。是否可以像这样在 Solr 中订购文章?

提前致谢。

0 投票
2 回答
797 浏览

solr - Solr 4.2 管理主页仅显示“正在加载...”

我刚刚在我的本地计算机上使用端口 8080 安装了 Solr 4.2 并使用 url 进行了测试 http://localhost : 8080/solr/,然后我使用 url 将其分享给我的同事,http://10.18.59.179:8080/solr/其中 10.18.59.179 是我公司的本地 IP。但是我的同事(他的 ip 是 10.18.59.105)告诉我,管理主页只显示“正在加载...”并挂在那里。我之前安装了 solr 3.3,他们可以正确连接到我计算机上的管理页面。Solr 4.2 的管理页面有什么问题?

0 投票
1 回答
622 浏览

tomcat - Solr indexing in Typo3 giving error

While I am trying to index pages I am getting error in the solr admin screen

The typo3 developer logs show the following:

I have configured the solr extension and set up looks good as per the 'Status Report' page on typo3 admin, but the errors appear and nothing gets indexed.

Could somebody suggest if there anything I am missing in setting up the solrconfig.xml and schema.xml file. Actually these are located in my solr home which is in '/var/solr../../example/solr/collection1/conf' and '/opt/lampp/htdocs/../../ext/../solr/resources/conf/' . I am confused about which of the configs is used and how solr extension in typo3 talks to the solr search engine via tomcat.

I am using:

SOLR 4.2.0 Solr extension 2.8.2 Lampp: 1.8.1 Tomcat 6

Please let me know if you need any other information as I am new to these technologies and need to set it up urgently.

Thanks in advance

0 投票
1 回答
84 浏览

solr - 使用 SOLR 搜索不是最新的

我正在编写一个应用程序,在其中我提供基于 SOLR 4 的搜索功能。我面临一个奇怪的行为:在大量索引的情况下,搜索请求并不总是“看到”新的索引数据。似乎索引阅读器没有经常刷新,只有在我从 Solr Core Admin 窗口手动刷新核心之后 - 预期的结果才会返回......

我正在使用JsonUpdateRequestHandler.

是配置问题吗?我是否需要配置 Solr 以某种方式更频繁地重新打开其索引阅读器?