问题标签 [solrconfig]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
solr - 如何过滤 Solr 自动完成/建议?
我已经实现了一个 Solr 建议处理程序来处理来自我的应用程序的自动完成建议。但是,我需要能够根据用户权限过滤这些结果。本质上,这可以确保返回的字段之一与键(例如用户名)匹配。
我的架构如下所示(自动完成字段):
SolrConfig中的建议处理程序:
如何过滤来自此处理程序的结果(最好不必在内存消费者端进行)?
solr - Solr分页中的queryResultWindowSize
我了解什么是 queryResultWindowSize 和 queryResultMaxDocsCached。
查询 1 -> q=car&rows=10&start=0
查询 2 -> q=car&rows=10&start=10
(假设查询 1 和 2 是 user1 的连续查询)
查询 3 -> q=boat&rows=10&start=0
查询 4 -> q=car&rows=10&start=10
(假设查询 3 和 4 是 user2 的连续查询)
我的 queryResultWindowSize = 20 和 queryResultMaxDocsCached = 20。当用户发出 query1 时,将缓存 20 个文档。因此,接下来的 10 个分页文档已在缓存中准备就绪。如果 user2 发出 query3 ,缓存会过期吗?还是缓存用于单个查询?solr 是否分别为 query1 和 query3 做缓存?
solr - 唯一建议者:AnalyzingInfixLookupFactory - Store Lookup build failed
我有这个配置(使用 solr 5.3.1):
schema.xml 中的字段定义为<field name="suggestion" type="suggest" indexed="true" stored="true" required="true" multiValued="true" />
.
字段类型定义是这样的:
每次我尝试构建索引时,solr 都会显示Store Lookup build failed
日志中没有转储或描述。
我在配置中遗漏了什么吗?建议者似乎工作正常,因此“内存中”索引工作正常。
谢谢
solr - Solr:在 SolrCloud 设置中使用 configSet 添加内核不起作用
我有一个 SolrCloud (v5.2) 设置,有 2 个不同的核心 [ users, docs
] 正常工作。
现在我需要能够动态添加新的核心,这些新核心在配置方面与docs
已经存在的核心相同。我不想复制配置(我试过了,它工作正常),因为我需要实际共享synonyms.txt
和其他一些不断变化的文件。
我认为我需要“配置集”,但我无法让它们工作。我使用以下命令上传了“模板”conf:
然后我尝试使用这样的配置集创建一个新核心template
:
但我得到这个错误:
我认为我对配置集的工作方式有一些缺失的知识。
csv - 可以使用 post.jar 将 CSV 文件中的部分列数导入到 Solr 吗?
我试图仅将CSV
文件的某些列导入 Solr,但我不确定如何执行此操作,或者这是否可以使用 Solr。目前,我正在使用books.csv
Solr 安装附带的示例之一(可以在C:\solr-5.2.1\example\exampledocs中找到)。
xml
如果包含所有字段,则我放入文件中的以下schema.xml
内容有效,但是如果我将某些字段注释掉,Solr 会抱怨那些被注释掉的未知字段。
因为C:\solr-5.2.1\bin中的 post 脚本是一个shell
脚本,并且不会在我正在使用的 Windows 中运行,所以我需要使用与该post.jar
文件位于同一位置的books.csv
文件。
solr - 基于词干的 Solr 搜索
我有一个场景,我使用 SnowballPorterFilterFactory 来阻止该字段。
现在它存储所有人才类型,例如:演员、舞者、歌手、模特等。
这种词干帮助我搜索使用
和
两个都。
现在我想搜索
我怎样才能把唱歌和歌手配对??
暂时不匹配..
solr - Solr 对 ContextField 的建议:并非所有对象都具有该字段
所以我有一个在 solr 中索引的数据库,我正在尝试使用 ContextField/cfq 过滤搜索建议(建议)。我想要做的是将建议查询过滤到上下文字段(布尔字段)设置为 false 或没有字段的元素。仅使用 false 不起作用,我不确定如何在 solrconfig.xml 中的Suggest.cfq 字段中制定它,因为该字段已被声明为上下文字段,而且我似乎无法做到 (-myfield:[* TO *] AND : ) 或 myfield:false . 如何做我想做的事?
solrconfig.xml 的相关块:
indexing - Solr 停用词不适用于通配符搜索
我在使用 solr 通配符搜索和停用词时遇到问题。我在 stopwords.txt 中添加了几个停用词“to”、“for”、“is”。当我不进行通配符搜索时,它工作得很好。
查询 -->q=learningObjectTopic:to&rows=1
当我进行通配符搜索时,它返回的数据。
查询 -->q=learningObjectTopic:*to*&rows=1
这是我的分析仪
我需要的是,“to”也不应该在通配符查询中匹配。我在这里想念什么?
注意: learningObjectTopic:当我在停用词中添加“to”时搜索结果中跳过的“to”字,因此停用词索引正在工作。
python - 发布到 Bluemix Retrieve_and_Rank 给出状态 0,但不起作用
我正在尝试为 Bluemix Retrieve and Rank 服务中的一些网页编制索引。所以我确实用 nutch 1.11 抓取了我的种子,将抓取的数据(大约 9000 个 URL)转储为文件,将那些可能的数据(例如 xml 文件)发布到我的收藏中:
并使用 Bluemix Doc-Conv 服务将其余部分转换为 json:
然后将这些 Json 结果保存在一个 json 文件中并将其发布到我的收藏中:
一切听起来都很好。json 文件应该是这样,当我发布数据时,我确实收到了状态 0,我认为这意味着发布是正确的。但是当我发送查询时:
结果什么都没有。它什么也没找到。我以前做过同样的事情,使用相同的命令结构和所有内容,并且它有效。我刚刚制作了一个新系列,现在它不起作用。
我的数据是否已编入索引?那么为什么查询不起作用?当我尝试获取 Solr 集群的使用统计信息时,结果是:
{"disk_usage":{"used_bytes":2210,"total_bytes":34359738368,"used":"2.1582 KB","total":"32 GB","percent_used":6.4319465309381485E-6},
"memory_usage":{"used_bytes":2069028864,"total_bytes":4194304000,"used":"1.9269 GB","total":"3.9063 GB","percent_used":49.3294921875}}
我认为这意味着我的数据已被索引并存储在我的集群中。刚才我意识到,每次我发布我的数据时,数据使用量和内存使用量都不会改变。这是否意味着发布未完成?即使我收到状态 0?如果是的话,有什么想法是什么问题?为什么会这样?
它与 solr_config 有什么关系吗?
任何有关如何从查询中获取结果的帮助或想法将不胜感激。