问题标签 [column-family]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
93 浏览

database - Apache Cassandra 不是聚合的好选择吗?

我读到 cassandra 无法为 SUM 或 AVG 等聚合提供足够的可能性。

实际上,我认为面向列的模型最适合此类操作。

我读了很多文章,但我就是不明白。除了可扩展性因素之外,使用 cassandra 的最佳典型用例是什么?

谢谢!

0 投票
1 回答
400 浏览

database - Cassandra 数据模型 - 列族

我在这里查看了一些问题,例如Understanding Cassandra Data Model and Column-family concept and data model,以及一些关于 Cassandra 的文章,但我仍然不清楚它的数据模型是什么。

Cassandra 遵循列族数据模型,类似于键值数据模型。在列族中,您有行和列中的数据,所以二维结构,除此之外,您还有列族中的分组?我想这是按列族组织的,以便能够跨多个节点对数据库进行分区?

行和列如何分组到列族中?为什么我们有列族?

例如,假设我们有消息数据库,作为行:

我们如何以及为什么要围绕列族数据模型来组织它?

注意:如有必要,请更正或扩展示例。

0 投票
0 回答
78 浏览

database - 如何在列族和文档存储数据库之间进行选择?

我正在做一个项目,我正在努力就是否使用列族或文档存储做出明确的决定。我的情况如下:

我正在进行的项目是一个 hass.io 应用程序,它将可视化特斯拉汽车的某些数据。我的项目将在树莓派(pi 3)上运行,因此数据库大小是一个问题。我的数据将如下所示:

}

  • 我的项目必须使用 NoSQL 数据库
  • 这个例子是 JSON 格式的,但它只是为了显示数据。它不必作为 JSON 文件本身存储在数据库中。
  • 预计汽车数量会很低(2-4 辆),数据量会增长得相当大(每分钟有几个新条目)

我希望能够在图表中绘制数据,因此我的查询很可能必须返回每辆车的每个数据点的时间戳和其他一些值,例如速度或电池电量。我的数据库将有非常少的客户端,并且不需要实时数据可视化。因此读取速度不是很重要。

据我的研究表明,根据这些要求,列族和文档存储体系结构并没有太大区别。除了可扩展性,但我不相信我的数据库会增长到我必须开始考虑分片的规模,如果我这样做了,我可能首先必须考虑垂直扩展。我相信这一点是对的还是有实际区别?

附带说明:我问这个问题是将列族与文档存储进行比较,但也许这种比较在这个级别是徒劳的,我必须开始查看特定的列存储和文档存储。如果是这样,我们也很感激在这个方向上的任何建议。

0 投票
1 回答
56 浏览

hbase - HBase 列族位置

五台服务器上有 HBase,一张表包含一列 Family,我应该map对每个键执行一些任务并保存结果。主要问题是:

保持数据局部性哪个更好:在现有表上创建新的列族或创建新表

和下一个问题:

HBase 文档建议保持低于三个列族,正如我所说,我有十多个map任务并且会将每个结果保留在新的列族中。我该怎么办?因为每个map任务都不同于另一个。局部性保持和搜索成本很重要。

0 投票
1 回答
83 浏览

java - hbase中特定列的前缀搜索在java中不起作用

有一列可以说 hbase 中的国家,我想在此列上添加前缀(这不是行键)然后我将使用 ColumnPrefixFilter 并执行类似的操作

但在这里我有两个问题:-

  1. 我没有任何选项来指定列族和命名空间名称,以便它只能在国家列中搜索。
  2. 其次,这个过滤器不起作用并且没有响应,而具有印度值的条目存在。这些是我用于 hbase 的依赖项。

    /li>
0 投票
0 回答
77 浏览

scala - Hbase 表列值无法更新 - 如果变量具有 NaN

我无法更新 hbase 列族中的值。条件是 - 如果变量 cricketScore 不是数字,则将值更新为“NA”,否则更新值。

我收到以下错误:

无法解析重载方法“toBytes”

无法解析符号?

无法解析符号 cricketScore

五月,我知道原因吗?以及如何解决这个问题?

0 投票
1 回答
148 浏览

hbase - Hbase 是否为每个 column-family 或 columnFamily:Column 创建一个 HFile?

我试图了解关于逻辑数据模型与物理数据存储的 Hbase 架构。我对 HFile 的创建有点困惑。如果我们有一个包含 2 列的列族,Hbase 是创建 2 个 HFile 还是只创建一个?

下面是我正在查看的图表,下面的示例显示了每个 cf:col 的逻辑到物理映射。请帮我解决这个困惑

https://mapr.com/blog/hbase-and-mapr-db-design-distribution-scale-and-speed/assets/blogimages/Logical-vs-physical-storage.png

0 投票
1 回答
483 浏览

cassandra - 如何理解 Cassandra 中宽行的概念及相关概念?

我觉得很难从Cassandra The Definite Guide中理解宽行的概念和相关概念:

Cassandra 使用称为复合键(或复合键)的特殊主键来表示宽行,也称为分区复合键由一个分区键和一组可选的集群列组成。 分区键用于确定存储行的节点,它本身可以由多个列组成。聚类列用于 控制数据在分区内存储的排序方式。Cassandra 还支持称为静态列的附加构造,用于存储不属于主键但由分区中的每一行共享的数据。

图 4-5 显示了如何通过 分区键唯一标识每个分区,以及如何使用集群键来唯一标识分区内的行。

在此处输入图像描述

宽行和分区是同义词吗?

在“分区键用于确定存储的节点,它本身可以由多个列组成”和“每个分区由一个分区键唯一标识”,

  • 由于分区键用于宽行,为什么会有多个“行”(这里的“行”是指“宽行”)?

  • 分区键如何“确定存储的节点”?

  • 分区键如何用于“每个分区由分区键唯一标识”?

在“聚类列用于控制数据在分区内存储的排序方式”中,

  • 什么是聚类列,例如图中的聚类列是什么?
  • 聚类列如何“控制数据在分区内存储的排序方式”?

在“聚类键用于唯一标识分区内的行”中,

  • 分区是宽行的同义词,“分区内的行”是什么意思?
  • 如何“使用聚类键来唯一标识分区内的行”?

谢谢。

0 投票
1 回答
36 浏览

cassandra - 卡桑德拉 | 将数据插入到具有相同行键的两个列族中

如果我有 2 个列族,一个用于客户信息,另一个用于客户地址信息,如何将客户信息及其地址信息插入到具有相同行键(客户 ID)的两个单独的列族中?

0 投票
1 回答
256 浏览

cassandra - Cassandra 动态列族

我是 cassandra 的新手,我阅读了一些关于静态和动态列族的文章。提到,从 Cassandra 3 表和列族是相同的。

我创建了键空间、一些表并将数据插入到该表中。

一切似乎都很好。

但我需要的是创建一个只有数据类型而没有预定义列的动态列族。

使用插入查询,我可以有不同的参数,并且应该插入表。

在文章中提到,对于动态列族,无需创建模式(预定义列)。我不确定这在 cassandra 中是否可行,或者我的理解是错误的。

让我知道这是否可能?如果可能,请提供一些示例。

提前致谢。