问题标签 [datastax-search]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
317 浏览

cassandra - 在 Cassandra 中使用 UDT 集合与非规范化行

成像我们在 RDBMS 中有 2 个表,INVOICE 和 INVOICE_LINE_ITEMS,INVOICE 和 INVOICE_LINE_ITEMS 之间存在一对多的关系。

发票 (1) --------> (*) INVOICE_LINE_ITEMS

上述实体现在需要存储在Cassandra中,为此我们可以遵循 2 种方法,

  1. 带有 PRIMARY KEY (invoice_id, invoice_line_item_id) 的非规范化表,对于一张发票,会有多个 line_item_id。

  2. 带有 SET<FROZEN<INVOICE_LINE_ITEMS_UDT>> 的 INVOICE 行

  3. 有 2 个表并负责更新 2 个表并在 DAO 代码中加入查询结果

用例是,

  1. 用户可以创建发票并不断添加、更新和删除行

  2. 用户可以使用 invoice 或 invoice_line_udt 属性进行搜索并获取发票详细信息(使用 DSE 搜索 solr_query)

  3. INVOICE(标题)可能包含 20 个属性,每个项目(invoice_line)可能包含大约 30 多个属性,一个大的 UDT,每个集合可能有大约 1000 行。

问题:

  1. 由于序列化和反序列化,使用冻结集合会影响读写性能。考虑到 UDT 包含 30 多个字段和最多 1000 个集合中的项目,这是一个好的方法还是数据模型?

  2. 因为存在序列化和反序列化,所以每次更新记录或分区时都会替换 UDT 的集合。列更新会创建墓碑吗?考虑到我们在项目(UDT 集合)中有很多更新,这会产生问题吗?

这是方法 1 的 CQL:(具有 UDT 集合的发票标题行)

这是方法 2 的脚本:(非规范化发票和行在一个分区但多行)

注意:我们使用 datastax cassandra + DSE 搜索。它不支持静态列,因此我们没有使用它。此外,为了提供真实的图片,我列出了包含很多列的表和 UDT,并最终创建了一个很长的问题。

0 投票
1 回答
94 浏览

datastax-enterprise - 使用 DSE Solr 时的数据

来自 Cassandra Datastax 文档:https ://docs.datastax.com/en/dse/5.1/dse-dev/datastax_enterprise/search/customizeSchemaSearch.html ,它是这样写的:

indexed="true" 的字段被索引并存储为 Lucene 中的辅助文件,以便可以搜索这些字段。索引字段存储在数据库中,而不是 Lucene 中,无论存储的属性值的值如何,复制字段除外。复制字段目标不存储在数据库中。

我想知道在运行 CQL Solr 请求时从哪里获取数据(例如 SELECT first_name, last_name FROM individual where solr_query=...)。

first_name 和 last_name 是从 cassandra 数据库还是从存储该字段的 Solr 索引中获取的?

我没有得到“索引=“true”的字段被索引并存储为 Lucene 中的辅助文件”,然后“索引字段存储在数据库中,而不是 Lucene 中”,这似乎是矛盾的?

谢谢你的帮助 !

0 投票
1 回答
42 浏览

solr - Solr:基于距离场的查询

我想用距离参数查询 solr 并且查询应该在距离范围内。

我们在 solr 中有所有城市索引及其纬度和边界现在我想从纬度运行查询,我想要所有在 50 公里范围之后和 100 公里范围以下的城市。

简而言之,我希望所有在 50 到 100 公里之间的城市都在给定的纬度范围内。

0 投票
1 回答
103 浏览

solr - 在 datastax 图中使用 gremlin 访问 Solr 的最佳方法

在 Datastax 图数据库中使用 Solr 的最佳方法是什么。所以,目前我们有 4 个节点集群,其中 3 个节点是 DSE,1 个节点用作 Solr 实例。

现在,目前我们正在使用 Solr Web 服务将 Solr 集成到我们使用 gremlin 与 DSE 对话的后端代码中。

现在,我们即将向集群添加一个 Solr 实例,并且使用 Solr webservice 似乎不是一个好的选择,因为我们将有多个 url 来访问正确的索引。

当您在后端的 Datastax 上使用 Gremlin 时,集成 Solr 的最佳方法是什么。

0 投票
1 回答
139 浏览

solr - Datastax Search / Solr中的分组和计数(*)

嗨,我们有一个 solr 索引,其中包含 diff 字段,例如 business、businessType、regionName、StateName ......

现在我需要一个 solr 查询来按 regionName 获取 businessType ='event' 组类型的业务数量。

如果我想为此编写一个 sql 查询,那就是select region_name , Count(business) from solr where businessType='event' group by region_name

任何指针都会有所帮助