问题标签 [solr]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
solr - solr DIH - 关于 solr delta-imports 的问题
使用 solr1.3 delta-imports 更新索引时出现问题。我在表中添加了“last_modified”列。在我使用“full-import”命令索引数据库数据后,“dataimport.properties”文件不包含任何内容,当我使用“delta-import”命令更新索引时,solr 列出数据库中的所有数据不上次的数据。我的 db-data-config.xml:
有人知道如何解决这个问题吗?谢谢!
enzhaohoo@gmail.com
search - 如何使用与 Solr 的 n-gram 近似匹配?
我们有一个电影和连续剧数据库,并且由于数据来自许多不同可靠性的来源,我们希望能够对剧集的标题进行模糊字符串匹配。我们在应用程序中使用 Solr 进行搜索,但默认匹配机制在单词级别上运行,这对于短字符串(如标题)来说不够好
过去我使用过 n-gram 近似匹配,我很高兴发现 Lucene(和 Solr)支持这种开箱即用的东西。不幸的是,我无法正确配置它。
我假设我需要一个特殊的字段类型,所以我在我的 schema.xml 中添加了以下字段类型:
并将架构中的相应字段更改为:
但是,这并没有像我预期的那样工作。查询分析看起来正确,但我没有得到任何结果,这让我相信在索引时发生了一些事情(即,标题被索引为默认字符串字段而不是 trigram 字段)。
我正在尝试的查询类似于
(有一两个错字)并且它应该匹配“Guy Walks into a Psychiatrist Office”。
(我不确定查询是否正确。)
此外,我实际上希望能够做更多的事情。我想将字符串小写,删除所有标点符号和空格,删除英语停用词,然后将字符串更改为三元组。但是,过滤器仅在字符串被标记后应用......
提前感谢您的回答。
ruby-on-rails - 如何使用acts_as_solr 获取所有文档
我正在做这样的事情:
它说它返回 297 个结果:
然而,当迭代它只显示 10 个项目:
我尝试添加 {:per_page=>80} 和 :limit=>:all 但它仍然显示这 10 个。知道我缺少什么吗?
drupal - 在 solr 中更改 xml 文件的原因
为了在 Drupal 中安装 apache solr 集成模块,我们需要安装 solr。
必须做的事情是我们需要将 solr schema.xml 和 configure.xml 文件更改为 apache solr 集成模块中的文件。
任何机构都可以解释这种变化背后的原因。
solr - Can I restrict the search to a specific date range?
I want to get all results AFTER a given date, can you do this with solr?
(http://lucene.apache.org/solr/)
Right now the results are search the entire result set, I want to filter for anything after a given date.
Update This isn't working for me yet.
My returned doc:
trying:
solr - Solr 搜索忽略了日期过滤器
在 solr 管理员(www.example.com:8065/solr/admin/file/?file=schema.xml,我的 schema.xml 看起来像:
我有一堆带有“测试”这个词的内容,所以我查询它:
如果我在最后添加日期或时间戳或 indexed_at 它不会改变结果吗?
可能是什么问题?
solr - 在 Solr 中搜索日期范围或空/无字段
我想在 Solr 中的文本字段上执行搜索。我想返回一个范围内或没有价值的所有匹配项。两个独立搜索词:
第一个返回范围内的所有匹配项。第二个返回“myfield”字段没有值的所有匹配项。 问题是将这两者结合起来。
这不返回任何匹配项:
这将返回开始和结束之间的匹配项,但不返回空条目:
java - Lucene 搜索结果按自定义订单列表排序(每个用户唯一)
我的应用程序中有经过身份验证的用户可以访问包含多达 500,000 个项目的共享数据库。每个用户都有自己的面向公众的网站,并且需要能够在他们自己的网站上对展示的项目进行优先级排序(想想投票)。
在 500,000 个项目中,他们可能只有 200 个优先项目,其余项目的顺序不太重要。
每个用户都会对项目进行不同的优先级排序。
我最初在这里问了一个类似的mysql问题,Mysql results sorted by list which is unique for each user and get a good answer但我相信更好的选择可能是选择非sql索引解决方案。
这可以在 Lucene 中完成吗?是否有另一种搜索技术会更好。
附言。Google 在其搜索结果中实施了类似的类型设置,如果您已登录,您可以在其中优先考虑和排除您自己的搜索结果。
更新:用 sphinx 重新标记,因为我一直在阅读文档,我相信它可能能够通过存储在内存中的“每个文档属性值”来做我正在寻找的东西 - 有兴趣从 sphinx 大师那里听到任何反馈
java - 搜索关键字列表以找出哪些关键字存在或不存在
我有一个包含不同部分的大型文档。每个部分都有一个感兴趣的关键字/短语列表。我有一个存储为字符串数组的关键字/短语的主列表。如何使用 Solr 或 Lucene 在每个部分文档中搜索所有关键字并基本上告诉我找到了哪些关键字?我想不出任何直接的方法来实现这个......
谢谢
asp.net - 搜索引擎 - Lucene 或 Solr
我们需要在我们的产品目录管理软件中集成一个搜索引擎。该目录预计将超过 4-5 百万。具有关系数据的记录分布在多个表中。我们的开发平台是 Asp.Net 3.5,我们在 Lucene 上做了一些初步的工作,发现它很好。然而,我们刚开始了解 Solr,并正在寻找一些实用的技巧来比较 Lucene 和 Solr 从实施、时间线、定期维护、性能、功能角度。任何指导或指示都会非常有帮助。谢谢。