问题标签 [datastax-search]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

15 问题

0 投票

0 回答

317 浏览

cassandra - 在 Cassandra 中使用 UDT 集合与非规范化行

成像我们在 RDBMS 中有 2 个表，INVOICE 和 INVOICE_LINE_ITEMS，INVOICE 和 INVOICE_LINE_ITEMS 之间存在一对多的关系。

发票 (1) --------> (*) INVOICE_LINE_ITEMS

上述实体现在需要存储在Cassandra中，为此我们可以遵循 2 种方法，

带有 PRIMARY KEY (invoice_id, invoice_line_item_id) 的非规范化表，对于一张发票，会有多个 line_item_id。

带有 SET<FROZEN<INVOICE_LINE_ITEMS_UDT>> 的 INVOICE 行

有 2 个表并负责更新 2 个表并在 DAO 代码中加入查询结果

用例是，

用户可以创建发票并不断添加、更新和删除行
用户可以使用 invoice 或 invoice_line_udt 属性进行搜索并获取发票详细信息（使用 DSE 搜索 solr_query）
INVOICE（标题）可能包含 20 个属性，每个项目（invoice_line）可能包含大约 30 多个属性，一个大的 UDT，每个集合可能有大约 1000 行。

问题：

由于序列化和反序列化，使用冻结集合会影响读写性能。考虑到 UDT 包含 30 多个字段和最多 1000 个集合中的项目，这是一个好的方法还是数据模型？
因为存在序列化和反序列化，所以每次更新记录或分区时都会替换 UDT 的集合。列更新会创建墓碑吗？考虑到我们在项目（UDT 集合）中有很多更新，这会产生问题吗？

这是方法 1 的 CQL：（具有 UDT 集合的发票标题行）

这是方法 2 的脚本：（非规范化发票和行在一个分区但多行）

注意：我们使用 datastax cassandra + DSE 搜索。它不支持静态列，因此我们没有使用它。此外，为了提供真实的图片，我列出了包含很多列的表和 UDT，并最终创建了一个很长的问题。

2017-11-16T04:22:57.287

0 投票

1 回答

94 浏览

datastax-enterprise - 使用 DSE Solr 时的数据

来自 Cassandra Datastax 文档：https ://docs.datastax.com/en/dse/5.1/dse-dev/datastax_enterprise/search/customizeSchemaSearch.html ，它是这样写的：

indexed="true" 的字段被索引并存储为 Lucene 中的辅助文件，以便可以搜索这些字段。索引字段存储在数据库中，而不是 Lucene 中，无论存储的属性值的值如何，复制字段除外。复制字段目标不存储在数据库中。

我想知道在运行 CQL Solr 请求时从哪里获取数据（例如 SELECT first_name, last_name FROM individual where solr_query=...）。

first_name 和 last_name 是从 cassandra 数据库还是从存储该字段的 Solr 索引中获取的？

我没有得到“索引=“true”的字段被索引并存储为 Lucene 中的辅助文件”，然后“索引字段存储在数据库中，而不是 Lucene 中”，这似乎是矛盾的？

谢谢你的帮助！

datastax-enterprise datastax-search

2018-01-11T12:55:35.867

0 投票

1 回答

42 浏览

solr - Solr：基于距离场的查询

我想用距离参数查询 solr 并且查询应该在距离范围内。

我们在 solr 中有所有城市索引及其纬度和边界现在我想从纬度运行查询，我想要所有在 50 公里范围之后和 100 公里范围以下的城市。

简而言之，我希望所有在 50 到 100 公里之间的城市都在给定的纬度范围内。

solr datastax-search

2019-12-02T15:47:47.323

0 投票

1 回答

103 浏览

solr - 在 datastax 图中使用 gremlin 访问 Solr 的最佳方法

在 Datastax 图数据库中使用 Solr 的最佳方法是什么。所以，目前我们有 4 个节点集群，其中 3 个节点是 DSE，1 个节点用作 Solr 实例。

现在，目前我们正在使用 Solr Web 服务将 Solr 集成到我们使用 gremlin 与 DSE 对话的后端代码中。

现在，我们即将向集群添加一个 Solr 实例，并且使用 Solr webservice 似乎不是一个好的选择，因为我们将有多个 url 来访问正确的索引。

当您在后端的 Datastax 上使用 Gremlin 时，集成 Solr 的最佳方法是什么。

solr datastax datastax-enterprise datastax-enterprise-graph datastax-search

2019-12-26T07:23:14.803

0 投票

1 回答

139 浏览

solr - Datastax Search / Solr中的分组和计数（*）

嗨，我们有一个 solr 索引，其中包含 diff 字段，例如 business、businessType、regionName、StateName ......

现在我需要一个 solr 查询来按 regionName 获取 businessType ='event' 组类型的业务数量。

如果我想为此编写一个 sql 查询，那就是select region_name , Count(business) from solr where businessType='event' group by region_name

任何指针都会有所帮助

solr datastax datastax-enterprise datastax-search

2020-02-03T10:18:22.077

1 2 3 4 5 6 7 8 9 10

问题标签 [datastax-search]

cassandra - 在 Cassandra 中使用 UDT 集合与非规范化行

datastax-enterprise - 使用 DSE Solr 时的数据

solr - Solr：基于距离场的查询

solr - 在 datastax 图中使用 gremlin 访问 Solr 的最佳方法

solr - Datastax Search / Solr中的分组和计数（*）

Reference