问题标签 [solandra]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
solr - 这些 Solr 查询如何/为什么会产生不同的结果?
我正在使用 Apache Solr 并使用具有文本字段PostBody
、整数Userid
字段和基于 trie 的日期时间字段的模式查询索引MostRecentActivityDate
。
我正在尝试将查询时间提升应用于我的select
查询,以便通过某些因素提升最近的帖子以帮助评分。我对此的价值观是试图有一个天的时间尺度,而不是许多在线日期提升示例中的年。
以下两个查询产生不同的结果,唯一不同的是提升“代码”的实际放置位置(即在字段条件本身之前或之后)。在我的测试中,我还注意到它们都产生了与没有 {} 提升代码时不同的结果,因此它不像在一种情况下被忽略。
有人能解释为什么他们会产生不同的结果吗?谢谢!
比。
solr - 在构面结果中计数
通过计算方面结果,我的意思是解决问题:
我有 7 个文件:
如果我按字段 B 进行构面查询,得到结果:B1=2,B2=2,B3=3。
我想通过字段 C 获取其他信息,例如结果计数。那么,我如何查询以获得类似于以下内容的结果:
谢谢
search - Solr 文档的频繁更新 - 效率/可扩展性问题
我有一个带有文档字段的 Solr 索引,例如:
在我的应用程序中,创建了一个包含一些整数id
和一些body_text
(最多 500 个字符)的文档。日期设置为输入时间,num_upvotes
并num_downvotes
从 0 开始。
我的应用程序使用户能够对上述内容进行投票和否决,而我想在 Solr 而不仅仅是数据库中跟踪这一点的原因是我希望能够考虑到我的search
.
这是一个问题,因为您不能简单地更新 solr 文档(即增加 up_votes 的数量)并且您必须替换整个文档,考虑到它需要访问我的数据库以再次获取所有相关数据,这可能是相当低效的。
我意识到该解决方案可能需要不同的数据布局,或者可能需要多个索引(尽管我不知道您是否可以跨 solr 核心进行查询/评分)。
有没有人能够就如何解决这个问题提供任何建议?
solr - Solr - 突出显示查询短语
是否可以突出显示整个查询词?fe 当我要求“美国”时,我想得到:
并不是:
我在整个互联网上搜索了答案,使用了hl.mergeContiguous、hl.usePhrasesHighlighter和hl.highlightMultiTerm参数的所有组合,但仍然无法使其工作。
我的查询是:
答案是:
我的“post_text”字段是:
我的“文本”类型是:
我还尝试将FastVectorHighlighter与hl.useFastVectorHighlighter=true一起使用,但遇到错误:
你能帮我吗?
solr - Lucene 查询错误:ArrayIndexOutOfBoundsException
我使用 Solandra (Solr 3.4 + Cassandra 1.0.3),做一些查询:
正确回答查询:
查询错误:
堆栈跟踪:
区别: [ 1221743600000 +TO+1323039600000] 和 [ 1321743600000 +TO+1323039600000] OR rows= 1 and rows= 0
索引定义:
我的查询或索引有什么问题?
solr - 通过 id 搜索文档非常慢
我的文档有一个名为“doc_id”的 id 字段,声明了以下属性:
这个 id 被标记为带有标签的唯一键。
我尝试一次加载许多文档,在请求 fe doc_id:(235, 163, 256, ..., 10473) 中给出它们的 ID
查询中的标识符计数永远不会超过 100。但是,存储中的文档越多,执行此查询所需的时间就越长。我认为这类似于 SQL 查询 fe "select doc where doc_id in (...)" 但在 "doc_id" 上使用索引时,执行时间应该是恒定的,不是吗?那么为什么在我添加越来越多的文档后 solandra 会变慢呢?
我正在使用 Solandra (Solr 3.4 + Cassandra 1.0.3)
问候,T
solandra - Solandra 分片:内部想法
刚开始使用 Solandra,并试图了解 Solandra 分片的 2 级细节。
AFAIK Soalndra 创建配置的分片数量(作为“solandra.shards.at.once”属性),其中每个分片的大小最大为“solandra.maximum.docs.per.shard”。
在下一个级别,它开始在每个分片内创建插槽,这些插槽由“solandra.maximum.docs.per.shard”/“solandra.index.id.reserve.size”定义。
我从 SchemaInfo CF 的数据模型中了解到,在特定的分片内,有不同物理节点拥有的插槽,这是节点之间为获取这些插槽而发生的竞争。
我的问题是:
这是否意味着如果我请求在特定的 solr 节点上写入,例如 .
....solandra/abc/dataimport?command=full-import
此请求是否会分发到所有可能的节点等。这是分布式写入吗?因为在这种情况发生之前,其他节点将如何竞争特定分片内的插槽。理想情况下,用于编写文档或一组文档的代码将在单个物理 JVM 上执行。通过分片,我们尝试在单个物理节点上编写一些文档,但是如果它是基于不同物理节点拥有的插槽进行编写,那么我们实际上实现了什么,因为我们再次需要从不同的节点获取结果。我了解写入吞吐量已最大化。
我们可以考虑调整这些数字吗?“
solandra.maximum.docs.per.shard
”,“solandra.index.id.reserve.size","solandra.shards.at.once
”。如果我在单个 DC 6 节点设置中只有一个分片和复制因子为 5,我看到这个分片的端点包含 5 个根据复制因子的端点。但是第 6 个会发生什么。我通过nodetool看到左边第6个节点并没有真正得到任何数据。如果我在保持集群开启的同时将复制因子增加到 6,这会解决问题并进行修复等,还是有更好的方法。
solr - 如何将数据添加到 solr 的架构
我尝试根据 solr 的架构向 solandra 添加新数据,但我找不到任何关于此的示例。我的最终目标是将 solandra 与 django-solr 集成。
我对基于原始solr和django-solr的solr中的插入和更新的理解是将http协议上的新数据发送到体面的路径,例如:
但是,当我访问 url 时,浏览器不断告诉我HTTP ERROR: 404
。
能不能帮我理解下solandra环境中添加新数据和删除数据的步骤?
我也看了一下reuters-demo,但是插入数据的过程是在reutersimporter.jar文件中处理的,但是我也看不到源代码。所以请帮助我了解系统在数据插入和删除方面的工作原理。
谢谢你。
solr - solandra json 更新
我尝试在 solandra 平台上使用 json api 上传文档。
为了做到这一点,我用来上传文档的命令是这样的
我得到了这个错误
我应该首先检查哪里来解决这个问题?
node.js - 带有solandra连接的nodejs
如何将nodejs与solandra连接起来?
如果可能提供一些示例代码
,我想用 solandra 学习 nodejs。
提供一些示例代码或一些网址