“solandra”的相关标签问题_Stack Overflow中文网

0 投票

1 回答

519 浏览

solr - 这些 Solr 查询如何/为什么会产生不同的结果？

我正在使用 Apache Solr 并使用具有文本字段PostBody、整数Userid字段和基于 trie 的日期时间字段的模式查询索引MostRecentActivityDate。

我正在尝试将查询时间提升应用于我的select查询，以便通过某些因素提升最近的帖子以帮助评分。我对此的价值观是试图有一个天的时间尺度，而不是许多在线日期提升示例中的年。

以下两个查询产生不同的结果，唯一不同的是提升“代码”的实际放置位置（即在字段条件本身之前或之后）。在我的测试中，我还注意到它们都产生了与没有 {} 提升代码时不同的结果，因此它不像在一种情况下被忽略。

有人能解释为什么他们会产生不同的结果吗？谢谢！

比。

2011-11-10T15:24:03.243

0 投票

1 回答

295 浏览

solr - 在构面结果中计数

通过计算方面结果，我的意思是解决问题：

我有 7 个文件：

如果我按字段 B 进行构面查询，得到结果：B1=2，B2=2，B3=3。

我想通过字段 C 获取其他信息，例如结果计数。那么，我如何查询以获得类似于以下内容的结果：

谢谢

solr lucene facet solandra

2011-11-14T10:08:23.603

0 投票

4 回答

1735 浏览

search - Solr 文档的频繁更新 - 效率/可扩展性问题

我有一个带有文档字段的 Solr 索引，例如：

在我的应用程序中，创建了一个包含一些整数id和一些body_text（最多 500 个字符）的文档。日期设置为输入时间，num_upvotes并num_downvotes从 0 开始。

我的应用程序使用户能够对上述内容进行投票和否决，而我想在 Solr 而不仅仅是数据库中跟踪这一点的原因是我希望能够考虑到我的search.

这是一个问题，因为您不能简单地更新 solr 文档（即增加 up_votes 的数量）并且您必须替换整个文档，考虑到它需要访问我的数据库以再次获取所有相关数据，这可能是相当低效的。

我意识到该解决方案可能需要不同的数据布局，或者可能需要多个索引（尽管我不知道您是否可以跨 solr 核心进行查询/评分）。

有没有人能够就如何解决这个问题提供任何建议？

search solr full-text-search solandra

2011-11-16T15:25:19.887

0 投票

2 回答

2317 浏览

solr - Solr - 突出显示查询短语

是否可以突出显示整个查询词？fe 当我要求“美国”时，我想得到：

并不是：

我在整个互联网上搜索了答案，使用了hl.mergeContiguous、hl.usePhrasesHighlighter和hl.highlightMultiTerm参数的所有组合，但仍然无法使其工作。

我的查询是：

答案是：

我的“post_text”字段是：

我的“文本”类型是：

我还尝试将FastVectorHighlighter与hl.useFastVectorHighlighter=true一起使用，但遇到错误：

你能帮我吗？

solr lucene solrj solandra

2011-11-29T09:55:31.323

0 投票

0 回答

878 浏览

solr - Lucene 查询错误：ArrayIndexOutOfBoundsException

我使用 Solandra (Solr 3.4 + Cassandra 1.0.3)，做一些查询：

正确回答查询：

查询错误：

堆栈跟踪：

区别： [ 1221743600000 +TO+1323039600000] 和 [ 1321743600000 +TO+1323039600000] OR rows= 1 and rows= 0

索引定义：

我的查询或索引有什么问题？

solr lucene solandra

2011-12-05T10:21:37.523

0 投票

2 回答

3707 浏览

solr - 通过 id 搜索文档非常慢

我的文档有一个名为“doc_id”的 id 字段，声明了以下属性：

这个 id 被标记为带有标签的唯一键。

我尝试一次加载许多文档，在请求 fe doc_id:(235, 163, 256, ..., 10473) 中给出它们的 ID

查询中的标识符计数永远不会超过 100。但是，存储中的文档越多，执行此查询所需的时间就越长。我认为这类似于 SQL 查询 fe "select doc where doc_id in (...)" 但在 "doc_id" 上使用索引时，执行时间应该是恒定的，不是吗？那么为什么在我添加越来越多的文档后 solandra 会变慢呢？

我正在使用 Solandra (Solr 3.4 + Cassandra 1.0.3)

问候，T

solr cassandra solandra

2011-12-12T10:34:25.423

0 投票

1 回答

260 浏览

solandra - Solandra 分片：内部想法

刚开始使用 Solandra，并试图了解 Solandra 分片的 2 级细节。

AFAIK Soalndra 创建配置的分片数量（作为“solandra.shards.at.once”属性），其中每个分片的大小最大为“solandra.maximum.docs.per.shard”。

在下一个级别，它开始在每个分片内创建插槽，这些插槽由“solandra.maximum.docs.per.shard”/“solandra.index.id.reserve.size”定义。

我从 SchemaInfo CF 的数据模型中了解到，在特定的分片内，有不同物理节点拥有的插槽，这是节点之间为获取这些插槽而发生的竞争。

我的问题是：

这是否意味着如果我请求在特定的 solr 节点上写入，例如 . ....solandra/abc/dataimport?command=full-import此请求是否会分发到所有可能的节点等。这是分布式写入吗？因为在这种情况发生之前，其他节点将如何竞争特定分片内的插槽。理想情况下，用于编写文档或一组文档的代码将在单个物理 JVM 上执行。
通过分片，我们尝试在单个物理节点上编写一些文档，但是如果它是基于不同物理节点拥有的插槽进行编写，那么我们实际上实现了什么，因为我们再次需要从不同的节点获取结果。我了解写入吞吐量已最大化。
我们可以考虑调整这些数字吗？“ solandra.maximum.docs.per.shard”，“ solandra.index.id.reserve.size","solandra.shards.at.once”。
如果我在单个 DC 6 节点设置中只有一个分片和复制因子为 5，我看到这个分片的端点包含 5 个根据复制因子的端点。但是第 6 个会发生什么。我通过nodetool看到左边第6个节点并没有真正得到任何数据。如果我在保持集群开启的同时将复制因子增加到 6，这会解决问题并进行修复等，还是有更好的方法。

solandra

2011-12-24T13:39:52.357

0 投票

2 回答

2634 浏览

solr - 如何将数据添加到 solr 的架构

我尝试根据 solr 的架构向 solandra 添加新数据，但我找不到任何关于此的示例。我的最终目标是将 solandra 与 django-solr 集成。

我对基于原始solr和django-solr的solr中的插入和更新的理解是将http协议上的新数据发送到体面的路径，例如：

但是，当我访问 url 时，浏览器不断告诉我HTTP ERROR: 404。

能不能帮我理解下solandra环境中添加新数据和删除数据的步骤？

我也看了一下reuters-demo，但是插入数据的过程是在reutersimporter.jar文件中处理的，但是我也看不到源代码。所以请帮助我了解系统在数据插入和删除方面的工作原理。

谢谢你。

solr solandra

2011-12-30T14:22:20.617

0 投票

1 回答

767 浏览

solr - solandra json 更新

我尝试在 solandra 平台上使用 json api 上传文档。

为了做到这一点，我用来上传文档的命令是这样的

我得到了这个错误

我应该首先检查哪里来解决这个问题？

solr solandra

2011-12-31T18:02:58.647

0 投票

1 回答

137 浏览

node.js - 带有solandra连接的nodejs

如何将nodejs与solandra连接起来？

如果可能提供一些示例代码
，我想用 solandra 学习 nodejs。

提供一些示例代码或一些网址

node.js solandra

2012-02-08T02:58:28.060

问题标签 [solandra]

Reference