问题标签 [solrnet]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
lucene - SolrNet/Solr - 更新与覆盖文档
我正在使用 SolrNet 与 Solr 索引进行交互。我有一个守护程序应用程序通过添加/更新/删除写入 Solr 索引。但是,对于 SolrNet,具有相同唯一键的 Add 会覆盖(替换)现有文档,而不是附加(组合)它们。
在 Lucene 中,我可以做这样的事情,其中 term 是文档键的 Lucene 术语。我怎样才能在 SolrNet 中做到这一点?我知道在方法中逐字段附加的(痛苦的)方法,但肯定有一种更简单的方法......
asp.net-mvc - 在哪里/如何将 Solr 安装到 ASP.net MVC 应用程序中(使用 nHibernate/存储库模式)
我目前正在处理一个相当大的基于问题/答案的应用程序(有点像 stackoverflow / answerbag.com) 我们使用 SQL (Azure) 和 nHibernate 进行数据访问,使用 MVC 进行 UI 应用程序。
到目前为止,在我们有一个Post表(包含问题/答案)的意义上,该模式大致沿着 stackoverflow db 的路线
可能会使用以下存储库接口的内容:
我的问题是:我将在哪里/如何将 solr 放入其中以便更好地查询这些“帖子”(我将使用 solrnet 与 Solr 进行实际通信)
理想情况下,我会将 SQL db 仅用作持久存储——上述 IQueryable 操作的大部分将移至某种 SolrFinder 类(或类似的类)
Body 属性是当前导致问题的一个 - 它相当大,并且会减慢 sql 的查询速度。
我的主要问题是,例如,如果有人“更新”了一篇文章——例如添加了一个新标签,那么整个文章都需要重新索引。显然,这样做需要这样的查询:
“SELECT * FROM POST WHERE ID = xyz”
这当然会非常缓慢。Solrnet 有一个 nHibernate 设施 - 但我相信这将与上述结果相同?
我想了一个办法来解决这个问题,我想听听你的看法:
- 将 ID 添加到队列(amazon sqs 或其他东西 - 我喜欢它的易用性)
- 在某处有一个服务(或一堆服务)来执行上述查询、构建文档并将其重新添加到 solr。
我的设计遇到的另一个问题: 应该从哪里调用“重新索引”方法?MVC 控制器?还是我应该有一个“PostService”类型的类来包装 IPostRepository 的实例?
任何指针都非常受欢迎!
solr - SolrNet - 得分总是 0
我使用 SolrNet 对 Solr 实例进行了简单查询,但由于某种原因,分数始终为 0。
我已经验证:
有一个字段 [SolrField("Score")] public double Score { get; 放; } 在我的映射类
已检查正在搜索的字段是字符串而不是文本。
还有什么可能是错的?请帮忙
更新:
solr - Solrnet 和集群
是否可以通过 SolrNet 在 Solr 查询中进行聚类?使用内置算法。像胡萝卜2等?任何人都可以分享一些示例代码或提示以继续吗?
solr - SolrNet 分面问题
使用 SolrNet 进行查询和分面。我有一个我想分面的 int、tdate 和 string 字段的组合。但是,我无法在同一个查询中混合 SolrFacetFieldQuery 和 SolrFacetQuery(用于范围)和 SolrFacetDateQuery(用于日期范围)。我收到一个错误“没有找到隐式类型数组的最佳类型”。应该如何处理最好?显然不想发送多个查询来获取其他方面。
我知道这很愚蠢,但一直困扰着我......
c# - Solr 和 .Net 过滤器
我对 Solr 的奇妙世界比较陌生,并且有以下问题。在提取文档结构并将其传递到 Solr 进行索引方面,处理文档的最佳方法是什么。
我希望能够从 Word 文档、PDF、电子表格、HTML 页面等中提取文本。事实上,几乎任何包含文本的文档。
我查看了 Windows 过滤器,乍一看,它们似乎提供了我需要的功能。
你会这样做吗?
西姆
asp.net - Solr Connection' 已在容器中注册
我在 asp.net 上使用 solr 搜索
当我第一次搜索时,它给了我正确的搜索结果,之后当我更改搜索参数并尝试搜索它时,它会给出错误(“Solr Connection'已经在容器中注册”)
所以请建议我如何删除它...
solr - 如何使用 apache Solr 1.4.1 配置 Apache Tika
我想索引大量的 pdf 文档。
我找到了一个参考,表明它可以使用 Apache Tika 来完成,但不幸的是,我找不到任何描述我可以在 Solr 1.4.1 中配置 Apache Tika 的参考。
配置完成后,我确实配置了它,如何在不使用 curl 的情况下直接将文档发送到 Solr?
我正在使用 solrnet 进行索引。
solrnet - Solr 停止响应(或减慢到糖蜜)...(Solr 新手)
在 Tomcat 6.0 /Win 2008 Server 下运行多核 Solr 并通过 SolrNet 进行 ASP.NET 查询。其中一个核心是巨大的,即约 2500 万个文档(约 20 GB 磁盘空间)和几个字段。其他 3 个内核要小得多(每个内核很少)。
在对大索引进行了几次查询后,Solr 的速度急剧下降并停止响应,即甚至无法打开管理控制台。如果我重新启动 tomcat,再进行一些查询,然后糖蜜就会停止。我检查了机器 RAM 和处理器的使用情况,两者的利用率都低于 50%。
我不确定问题可能是什么 - 内存泄漏?我怎样才能找到问题?我不太了解 Solr/Tomcat 日志以及我应该查看哪些日志。
希望有人可以提供帮助。
solrnet - SolrNet 的多个方面
我想对 SolrNet、City 和 Category 的两个方面进行查询。但是每个方面都有不同的属性。例如,城市的 mincount 为零,类别为 1。
我怎样才能用 SolrNet 做到这一点?
我知道 FacetParametes 具有可以是查询数组的 Queries 属性,但是 mincount 呢?
谢谢。