问题标签 [solr-schema]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
solr - Solr全文搜索动态添加的数据?
我正在尝试在不定义 schema.xml 的情况下对数据进行索引,是否有任何方法可以在不添加 schema.xml 或更新管理的 shema 的情况下应用全文搜索?
solr - 是否有理由将字段复制到索引中的构面字段中?
我正在查看一个非常古老的 solr 实例(自上次接触以来 4-6 年),并且我看到了这些额外的动态字段,“f_ ”和“fs_ ”用于多值和单值方面字段。
不过,我的理解是,方面只发生在查询时。
此外,它只是一个副本 - 字段不会更改类型。
所以在我将这些领域用核武器摧毁之前,王国来临;索引中的构面字段是否只是复制字段的原因?
谢谢
solr - 当查询词混乱时,Solr 搜索结果会发生变化
我已经用字段索引了一个文件-
- 内容(类型:text_general,不可逆:false,索引:true,存储:true)
- 类别(类型:text_general,不可逆:false,索引:true,存储:true)
- 标题(类型:text_general,不可逆:false,索引:true,存储:true)
有一个包罗万象的copyfield -
来源:*,
目的地:_text_
现在,当我搜索Content字段时,查询 - Apple trade ,我得到 6057 个文档;
但是当我搜索交易 Apple 时,我得到了 5878 个文档。
但是,当在catch-all字段上执行相同的搜索时,两个查询(6057 文档)都会得到相同的结果。
我不理解这里的错误,因为我希望 solr 在Content字段上搜索时为两个查询提供相同的结果。
我在用-
- LuceneQParser
- 经典相似度
“内容”字段的两个查询:
- 苹果贸易
http://localhost:8983/solr/core_name/select?q=Content%3A%20Apple%20trade
- 交易苹果
http://localhost:8983/solr/core_name/select?q=Content%3A%20trade%20Apple
solr - 具有 Wordnet 格式的同义词文件的同义词图过滤器不起作用
我正在使用 Solr 8.3 并尝试以wordnet格式传递同义词文件,例如-
s(300880586,1,'增强',s,1,0)。
s(300880765,1,'增强',s,1,0)。
s(300881030,1,'双曲线',s,1,2)。
s(300881030,2,'膨胀',s,1,1)。
在托管模式文件中,我将同义词图过滤器配置为-
但是,它没有用。也许我可能错过了一些配置或格式的一些问题。
所以我尝试将文件转换为 Solr 格式,它以某种方式工作。
我只想使用 wordnet 格式,所以如果有人能帮助我理解我在这里犯的错误,那会很有帮助。
docker - 在 Docker 中运行时向 Solr 添加字段?
我在 Docker 中运行 Solr。我需要在架构中添加一些自定义字段。这通常可以通过与此类似的命令来完成:
但是我已经将我的 Solr 移到了 Docker 容器中,但我不知道如何在 docker-compose.yml 中做同样的事情。
我的 docker-compose.yml 使用以下命令启动 Solr:
任何建议如何做到这一点将不胜感激!
python-3.x - 关于将更改加载到架构的 Solr 问题
我是 Solr 的新手,通过添加文档时收到以下错误pysolr
:
我最终发现periodical_nlm
添加的第一个值是404536.0
,所以我认为这是一个类型问题。在 Python 中,我periodical_nlm
在添加之前将 every 显式转换为字符串2984692R
。但是,错误仍然存在。
我用谷歌搜索了一下,发现我可能应该明确告诉 Solr 我希望该字段是一个字符串。我还没有非常“动手”使用模式,所以我有一些问题:
(1) 似乎有两个模式文件:managed-schema
在核心目录和核心文件夹managed-schema
中conf
。我假设正在使用的初始化模式是conf
文件夹中的模式?
(2) 为了让事情顺利进行,我应该更新哪些内容?我尝试将以下内容添加到核心目录中的架构文件中,但错误仍然存在:
我是否需要重新运行一些初始化过程或conf
单独向文件中添加一些内容?
非常感谢,如果您需要更多信息,请告诉我。我在 Windows 10 Home x64 平台上运行(如果我需要运行任何命令行的东西,不确定这是否重要......)。
indexing - 在 solr 中索引原始标记
假设我有一个字段类型如下:
我的目标是为每个令牌索引原始令牌以及通过所有令牌过滤器后的令牌。例如,对于文本:
当前字段类型(如上所述)将索引以下标记:
由于 stopWords 过滤器,“is”将被删除,并且由于词干过滤器,“barking”将变为“bark”。
我希望将索引以下标记:
我考虑了 WordDelimiterGraphFilterFactory 中的“perserveOriginal”参数,但它仅适用于具有特殊字符的标记,并且“原始标记”之后通过其他过滤器。
我知道最明显的方法是编写一个自定义的 TokenFilter,在标记器之后立即以原始形式索引标记,但我的问题是 Solr 中是否有内置的东西允许它。
我正在使用 Solr 6.5.1
谢谢 :)
drupal - 初始化 Solr 核心时出错:加载类“solr.ICUCollationField”时出错
使用 Drupal,我们尝试从 solr_api_search 模块导入配置文件。导入它们并尝试初始化核心时,我看到以下错误(Solr 7.7.2):
这就是 solrcore.properties 文件内部的样子。solr.install.dir
在一些有类似问题的人报告说它解决了他们的问题后,我添加了该选项:
这是使用 ps -ef 运行的进程:
我里面有以下库/opt/solr/contrib/analysis-extras/lib
为了让 Solr 加载 .jar 文件,我是否缺少一些选项?