问题标签 [solandra]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
519 浏览

solr - 这些 Solr 查询如何/为什么会产生不同的结果?

我正在使用 Apache Solr 并使用具有文本字段PostBody、整数Userid字段和基于 trie 的日期时间字段的模式查询索引MostRecentActivityDate

我正在尝试将查询时间提升应用于我的select查询,以便通过某些因素提升最近的帖子以帮助评分。我对此的价值观是试图有一个天的时间尺度,而不是许多在线日期提升示例中的年。

以下两个查询产生不同的结果,唯一不同的是提升“代码”的实际放置位置(即在字段条件本身之前或之后)。在我的测试中,我还注意到它们都产生了与没有 {} 提升代码时不同的结果,因此它不像在一种情况下被忽略。

有人能解释为什么他们会产生不同的结果吗?谢谢!

比。

0 投票
1 回答
295 浏览

solr - 在构面结果中计数

通过计算方面结果,我的意思是解决问题:

我有 7 个文件:

如果我按字段 B 进行构面查询,得到结果:B1=2,B2=2,B3=3。

我想通过字段 C 获取其他信息,例如结果计数。那么,我如何查询以获得类似于以下内容的结果:

谢谢

0 投票
4 回答
1735 浏览

search - Solr 文档的频繁更新 - 效率/可扩展性问题

我有一个带有文档字段的 Solr 索引,例如:

在我的应用程序中,创建了一个包含一些整数id和一些body_text(最多 500 个字符)的文档。日期设置为输入时间,num_upvotesnum_downvotes从 0 开始。

我的应用程序使用户能够对上述内容进行投票和否决,而我想在 Solr 而不仅仅是数据库中跟踪这一点的原因是我希望能够考虑到我的search.

这是一个问题,因为您不能简单地更新 solr 文档(即增加 up_votes 的数量)并且您必须替换整个文档,考虑到它需要访问我的数据库以再次获取所有相关数据,这可能是相当低效的。

我意识到该解决方案可能需要不同的数据布局,或者可能需要多个索引(尽管我不知道您是否可以跨 solr 核心进行查询/评分)。

有没有人能够就如何解决这个问题提供任何建议?

0 投票
2 回答
2317 浏览

solr - Solr - 突出显示查询短语

是否可以突出显示整个查询词?fe 当我要求“美国”时,我想得到:

并不是:

我在整个互联网上搜索了答案,使用了hl.mergeContiguoushl.usePhrasesHighlighterhl.highlightMultiTerm参数的所有组合,但仍然无法使其工作。

我的查询是:

答案是:

我的“post_text”字段是:

我的“文本”类型是:

我还尝试将FastVectorHighlighterhl.useFastVectorHighlighter=true一起使用,但遇到错误:

你能帮我吗?

0 投票
0 回答
878 浏览

solr - Lucene 查询错误:ArrayIndexOutOfBoundsException

我使用 Solandra (Solr 3.4 + Cassandra 1.0.3),做一些查询:

正确回答查询:

查询错误:

堆栈跟踪:

区别: [ 1221743600000 +TO+1323039600000] 和 [ 1321743600000 +TO+1323039600000] OR rows= 1 and rows= 0

索引定义:

我的查询或索引有什么问题?

0 投票
2 回答
3707 浏览

solr - 通过 id 搜索文档非常慢

我的文档有一个名为“doc_id”的 id 字段,声明了以下属性:

这个 id 被标记为带有标签的唯一键。

我尝试一次加载许多文档,在请求 fe doc_id:(235, 163, 256, ..., 10473) 中给出它们的 ID

查询中的标识符计数永远不会超过 100。但是,存储中的文档越多,执行此查询所需的时间就越长。我认为这类似于 SQL 查询 fe "select doc where doc_id in (...)" 但在 "doc_id" 上使用索引时,执行时间应该是恒定的,不是吗?那么为什么在我添加越来越多的文档后 solandra 会变慢呢?

我正在使用 Solandra (Solr 3.4 + Cassandra 1.0.3)

问候,T

0 投票
1 回答
260 浏览

solandra - Solandra 分片:内部想法

刚开始使用 Solandra,并试图了解 Solandra 分片的 2 级细节。

AFAIK Soalndra 创建配置的分片数量(作为“solandra.shards.at.once”属性),其中每个分片的大小最大为“solandra.maximum.docs.per.shard”。

在下一个级别,它开始在每个分片内创建插槽,这些插槽由“solandra.maximum.docs.per.shard”/“solandra.index.id.reserve.size”定义。

我从 SchemaInfo CF 的数据模型中了解到,在特定的分片内,有不同物理节点拥有的插槽,这是节点之间为获取这些插槽而发生的竞争。

我的问题是:

  1. 这是否意味着如果我请求在特定的 solr 节点上写入,例如 . ....solandra/abc/dataimport?command=full-import此请求是否会分发到所有可能的节点等。这是分布式写入吗?因为在这种情况发生之前,其他节点将如何竞争特定分片内的插槽。理想情况下,用于编写文档或一组文档的代码将在单个物理 JVM 上执行。

  2. 通过分片,我们尝试在单个物理节点上编写一些文档,但是如果它是基于不同物理节点拥有的插槽进行编写,那么我们实际上实现了什么,因为我们再次需要从不同的节点获取结果。我了解写入吞吐量已最大化。

  3. 我们可以考虑调整这些数字吗?“ solandra.maximum.docs.per.shard”,“ solandra.index.id.reserve.size","solandra.shards.at.once”。

  4. 如果我在单个 DC 6 节点设置中只有一个分片和复制因子为 5,我看到这个分片的端点包含 5 个根据复制因子的端点。但是第 6 个会发生什么。我通过nodetool看到左边第6个节点并没有真正得到任何数据。如果我在保持集群开启的同时将复制因子增加到 6,这会解决问题并进行修复等,还是有更好的方法。

0 投票
2 回答
2634 浏览

solr - 如何将数据添加到 solr 的架构

我尝试根据 solr 的架构向 solandra 添加新数据,但我找不到任何关于此的示例。我的最终目标是将 solandra 与 django-solr 集成。

我对基于原始solr和django-solr的solr中的插入和更新的理解是将http协议上的新数据发送到体面的路径,例如:

但是,当我访问 url 时,浏览器不断告诉我HTTP ERROR: 404

能不能帮我理解下solandra环境中添加新数据和删除数据的步骤?

我也看了一下reuters-demo,但是插入数据的过程是在reutersimporter.jar文件中处理的,但是我也看不到源代码。所以请帮助我了解系统在数据插入和删除方面的工作原理。

谢谢你。

0 投票
1 回答
767 浏览

solr - solandra json 更新

我尝试在 solandra 平台上使用 json api 上传文档。

为了做到这一点,我用来上传文档的命令是这样的

我得到了这个错误

我应该首先检查哪里来解决这个问题?

0 投票
1 回答
137 浏览

node.js - 带有solandra连接的nodejs

如何将nodejs与solandra连接起来?

如果可能提供一些示例代码
,我想用 solandra 学习 nodejs。

提供一些示例代码或一些网址