问题标签 [datastax-search]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
cassandra - 在 Cassandra 中使用 UDT 集合与非规范化行
成像我们在 RDBMS 中有 2 个表,INVOICE 和 INVOICE_LINE_ITEMS,INVOICE 和 INVOICE_LINE_ITEMS 之间存在一对多的关系。
发票 (1) --------> (*) INVOICE_LINE_ITEMS
上述实体现在需要存储在Cassandra中,为此我们可以遵循 2 种方法,
带有 PRIMARY KEY (invoice_id, invoice_line_item_id) 的非规范化表,对于一张发票,会有多个 line_item_id。
带有 SET<FROZEN<INVOICE_LINE_ITEMS_UDT>> 的 INVOICE 行
有 2 个表并负责更新 2 个表并在 DAO 代码中加入查询结果
用例是,
用户可以创建发票并不断添加、更新和删除行
用户可以使用 invoice 或 invoice_line_udt 属性进行搜索并获取发票详细信息(使用 DSE 搜索 solr_query)
INVOICE(标题)可能包含 20 个属性,每个项目(invoice_line)可能包含大约 30 多个属性,一个大的 UDT,每个集合可能有大约 1000 行。
问题:
由于序列化和反序列化,使用冻结集合会影响读写性能。考虑到 UDT 包含 30 多个字段和最多 1000 个集合中的项目,这是一个好的方法还是数据模型?
因为存在序列化和反序列化,所以每次更新记录或分区时都会替换 UDT 的集合。列更新会创建墓碑吗?考虑到我们在项目(UDT 集合)中有很多更新,这会产生问题吗?
这是方法 1 的 CQL:(具有 UDT 集合的发票标题行)
这是方法 2 的脚本:(非规范化发票和行在一个分区但多行)
注意:我们使用 datastax cassandra + DSE 搜索。它不支持静态列,因此我们没有使用它。此外,为了提供真实的图片,我列出了包含很多列的表和 UDT,并最终创建了一个很长的问题。
datastax-enterprise - 使用 DSE Solr 时的数据
来自 Cassandra Datastax 文档:https ://docs.datastax.com/en/dse/5.1/dse-dev/datastax_enterprise/search/customizeSchemaSearch.html ,它是这样写的:
indexed="true" 的字段被索引并存储为 Lucene 中的辅助文件,以便可以搜索这些字段。索引字段存储在数据库中,而不是 Lucene 中,无论存储的属性值的值如何,复制字段除外。复制字段目标不存储在数据库中。
我想知道在运行 CQL Solr 请求时从哪里获取数据(例如 SELECT first_name, last_name FROM individual where solr_query=...)。
first_name 和 last_name 是从 cassandra 数据库还是从存储该字段的 Solr 索引中获取的?
我没有得到“索引=“true”的字段被索引并存储为 Lucene 中的辅助文件”,然后“索引字段存储在数据库中,而不是 Lucene 中”,这似乎是矛盾的?
谢谢你的帮助 !
solr - Solr:基于距离场的查询
我想用距离参数查询 solr 并且查询应该在距离范围内。
我们在 solr 中有所有城市索引及其纬度和边界现在我想从纬度运行查询,我想要所有在 50 公里范围之后和 100 公里范围以下的城市。
简而言之,我希望所有在 50 到 100 公里之间的城市都在给定的纬度范围内。
solr - 在 datastax 图中使用 gremlin 访问 Solr 的最佳方法
在 Datastax 图数据库中使用 Solr 的最佳方法是什么。所以,目前我们有 4 个节点集群,其中 3 个节点是 DSE,1 个节点用作 Solr 实例。
现在,目前我们正在使用 Solr Web 服务将 Solr 集成到我们使用 gremlin 与 DSE 对话的后端代码中。
现在,我们即将向集群添加一个 Solr 实例,并且使用 Solr webservice 似乎不是一个好的选择,因为我们将有多个 url 来访问正确的索引。
当您在后端的 Datastax 上使用 Gremlin 时,集成 Solr 的最佳方法是什么。
solr - Datastax Search / Solr中的分组和计数(*)
嗨,我们有一个 solr 索引,其中包含 diff 字段,例如 business、businessType、regionName、StateName ......
现在我需要一个 solr 查询来按 regionName 获取 businessType ='event' 组类型的业务数量。
如果我想为此编写一个 sql 查询,那就是select region_name , Count(business) from solr where businessType='event' group by region_name
任何指针都会有所帮助