问题标签 [faceted-search]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
dataset - 需要 RDF 样本数据集
大家好,我一直在寻找足够大的语义数据集来对我正在开发的算法进行一些测试。
我的意思是一个已经存在的 RDF/XML 文件,我可以“轻松”上传到 AllegroGraph。我发现了几个虚拟数据集,但它们使用了不切实际的数据,如“char1”、“char2”、“node121”等。起初还可以。
但现在我需要使用关于真实事物的数据集进行测试,无论是汽车、植物、电影、书籍等。几个组合将是理想的。特别是一个具有超过 50k 个对象且至少具有 3 或 4 个方面的对象。有人告诉我这些数据集在某个地方,但我找不到它们。
欢迎任何链接、指针或建议。此外,如果有更好的网站来发布这个问题,我会听从建议。
solr - Solr More Like This 结果由 facet 字段缩小
我有一个用于索引多个站点内容的 Solr 实例。在编制索引时,我正在填充网站字段,以便能够在该字段上为每个特定网站执行分面搜索……而且效果很好。
但是,如果我使用 Solr MLT 功能,我会从所有网站获得结果,并且我想将 MLT 结果缩小到单个网站。
是否可以为 Solr MLT 定义 facet,或者是否有其他更好的方法来实现这一点?
如果 Solr 支持,它是否也可以在 solrnet 中使用?
drupal - 有人知道 Drupal 7 的多面搜索解决方案吗?
分面搜索模块未移至 Drupal 7。
我的替代方案是什么?
solr - NoSQL 系统中的方面类似功能
有谁知道/有人可以指向一个现成的支持刻面的nosql db吗,比如在Apache SOLR中?
我已经读过,在 Sphinx 中,它们不支持开箱即用的方面搜索,但可以以插件的形式实现它。
Upd:我只对企业级系统感兴趣。
solr - 无重复数据的分面搜索(无 ETL)
到目前为止,我看到的所有解决方案都涉及使用 nosql 或数据仓库来复制数据。有没有更有效的方法?
2011-06-07 编辑:当我说没有重复时,我的意思是也没有ETL。我想直接从主数据库中提取数据。这是相关的,但我及时改变。
java - Solr 3.1 构面范围查询
有没有人成功使用 Solr 3.1 方面的数值范围?例如对于具有 double 或 tdouble 字段类型的文档字段?(无分析仪)
我对 SolrJ 的请求似乎完全忽略了 f.[fieldname].facet.range.start .end 和 .gap 指令,我得到了未分组的结果。
(常规方面工作正常)
php - postprocess solr 的多面搜索结果
我不确定如何处理以下问题。所以我希望在这里得到一些想法或类似的东西。我正在使用带有 solr 的 lucene。每个文档(在 lucene 中被索引)都有一个日期字段和一个主题字段(带有一些关键字)
通过使用分面搜索,我能够计算每个关键字在特定日期的频率。
示例 1(伪代码):
但现在我想将结果组合到一个 solr/lucene 查询中,以计算哪个词频增长得非常强而女巫没有。结果可能是:
示例 2:
是否可以(并且有用)在 solr 中进行这种整合(和计算),还是最好启动 2 个 solr 查询(参见示例 1),然后使用 PHP 对结果进行后处理?
比你!
php - 将多个 solr 分面搜索合并为一个
我有一系列产品。对于每个产品,我都必须创建一个 solr faceted 搜索。
以下“产品”的示例:
通过使用分面搜索,我想确定每种产品在 PRODUCT 字段中存在的频率。结果如下
现在,我意识到通过对每个单词/产品使用一个多面搜索。这可行,但使用以下选项在 400 毫秒内返回结果:
不幸的是,在现实生活中没有 3 种产品(如上面的示例),大约有 100 种相关产品。这意味着:PHP 脚本必须请求 100 次 solr 搜索,时间为 400 毫秒 - 所以脚本运行 40 秒,这太长了。我无法对“所有”产品(没有“fq =”)进行无限制/无限制的多面搜索,因为有成千上万的产品,我不需要每个人的信息。
有没有办法实现更好的性能,例如将这些多个 solr 请求合并为一个?
谢谢!
lucene - PatternTokenizerFactory 和停用词
solr/lucene 中一个名为 COLORS 的文档字段有一组像这样的词:
字段 1:蓝色/深红色/绿色字段 2:蓝色/黄色/橙色 [...]
我需要对其进行多面搜索以获取所有颜色和每种颜色的计数。首先我尝试了 PatternTokenizerFactory,然后是停用词列表:
不幸的是,停用词列表接缝被忽略。停用词出现在多面搜索结果中。
这个SO question描述了同样的问题。不幸的是,发布的解决方案对我不起作用,因为我不能使用 solr.StandardTokenizerFactory,因为标准标记器也会在 whitspaces 上拆分标记。这意味着“深红色”变成“深色”和“红色”,这是错误的。
有没有办法使用模式标记器?
感谢您提供任何帮助!
lucene - Does Lucene support Faceted Search with Multiple Field Values
I am reading this article from http://www.devatwork.nl/index.php/articles/lucenenet/faceted-search-and-drill-down-lucenenet/
The author did not say whether Lucene support storing multiple values in each field.
To follow the example in the article, a book may have multiple genres and multiple authors.
Is it possible to store more than one genres in the genre field?
Is it also possible to perform searches using multiple genres or multiple authors? The result should return a document if matching one or more of the query genres and matching one or more of the authors.
Thanks,
Vu Dang