问题标签 [solr4]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
solr - 仅检索突出显示的 solr 字段而不是全部内容
我想使用 solr 索引 pdf、word 文档。word / pdf 文档的全部内容都出现在搜索响应和突出显示的片段中。内容很长,由于内容长度,我想在搜索响应中避免它。
是否可以仅获取内容字段的突出显示片段?
这是搜索查询
http://localhost:8080/solr4x/collection1/select?q=Scripting&wt=xml&hl=true&hl.fl=content
这是架构
<field name="content" type="text_general" indexed="false" stored="true"multiValued="true"/>
<field name="text" type="text_general" indexed="true" stored="false" multiValued="true"/>
我正在使用 solr 4.3
solr - 兼容系列 - SOLR 4 / SOLRCloud
我试图通过兼容集合来弄清楚 SOLR 的含义,以便能够运行以下查询:
Query all shards of multiple compatible collections, explicitly specified:
http://localhost:8983/solr/collection1/select?collection=collection1_NY,collection1_NJ,collection1_CT
这是否意味着这些集合之间的 schemas.xml 必须完全相同或只是部分相同(共享用于满足查询的相同字段)?
干杯,/马辛
solr - Solrcloud 删除集合错误?
首先,我创建了一个名为usercollection的集合:
然后我发现有问题,所以我删除了它。
最后,我想再次创建集合。而且我发现了一些不对劲的地方。
所以,我认为删除时集合API有问题。因此,我怎样才能真正删除一个集合?
solr - 与服务器交谈时发生 Solrj IOException
我正在使用基本身份验证。我的 solr 版本是 4.1。我可以获得查询结果,但是当我尝试索引文档时,我收到以下错误消息:
这是我的代码片段:
我究竟做错了什么?
solr - 在 Solr 4 中搜索字符串中的单词
在 solr 4 上,我正在查询单词“black”,它返回唯一具有确切单词的产品的结果 - 名称和 desc 中的“black”。我只搜索名称和描述。
但是,我想在搜索结果中包含很多单词.. 就像结果应该包含.. Jadeblack、Superblack、blackblue、nightblack 和其他在字符串中任何地方都有黑色的单词,而不仅仅是单词 black。
但是,此类结果的相关性较低,应排在带有“黑色”一词的结果之后。
你能告诉我应该如何改变以获得这种结果。
apache - 将上传文件接口添加到我的 solr 浏览器
我是 solr 4.0 的新手。我已经制作了一个自定义浏览器站点。
1)我想给它添加一个上传文件接口,这样客户就可以从家里上传自己的文件了。
2)上传文件后,我想使用我制作的 jar 应用程序对其进行解析和编辑。
据我所知,我唯一能想到的就是每隔几分钟运行一次解析器,并使用 SolrJ 搜索新文档来解析和更新。
我看到有一种更聪明的方法,使用 http://wiki.apache.org/solr/DataImportHandler#EventListeners 但我不明白如何运行我自己的 jar 文件。
solr - 分离 Nutch 正则表达式文件以抓取和索引到多个 Solr 核心
我的设置是:Ubuntu Server 12.04 LTS 上的 Nutch 1.6 和 Solr 4.3.0
我需要对大型网站的内容进行爬网和索引,并且希望使用单独的核心来执行此操作。
我已经配置了 Solr 并以这种方式启动它:
然后我配置并启动了 Nutch 两次,每个源 urls 文件夹和索引目标(core0,core1):
结果很完美,但是为了过滤掉不需要的 URL 模式,我必须在 regex-urlfilter.txt 文件中指定一些正则表达式。由于两个爬网会话的正则表达式集不同,我必须在运行第二次爬网之前编辑 regex-urlfilter.txt 文件。
问题:有没有办法准备两个单独的 regex-urlfilter.txt 文件并在每个 /bin/nutch 命令行上指定正确的文件?
请考虑我开始实验配置时使用了 2 个 url 集和核心,但我必须配置至少 5 个,并且应该将它们配置为自动重新抓取,而无需在其间进行手动编辑会话......
solr - 在 solr 中没有被删除的记录
我正在使用以下查询来删除 solr 的记录,但它没有被删除。
在这个查询之后我运行
我仍然得到结果,这意味着没有执行删除操作
请提出解决方案
solr - 未找到 Solr 4 空间类 com/vividsolutions/jts/geom/Geometry
我正在运行 Solr 4.2.1,但我的日志文件中有异常NoClassDefFoundError: com/vividsolutions/jts/geom/Geometry
。我检查过类似的问题,例如如何在 Solr 4 中安装 JTS?但这并没有解决问题。
列出 solr.war 的内容我在正确的路径中有 jts 库
但这并不能解决我的问题。我错过了什么吗?
solr - Solr 从 fl 中排除字段
它将返回 solr 中存在的所有字段。但我想从字段列表中排除一两个字段。怎么做?