问题标签 [column-family]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1227 浏览

column-family - 宽列 vs 列族 vs 列 vs 面向列的数据库定义

这些术语之间有很多混淆。我想通过我的理解,看看人们是否同意。我在网上看到了相互矛盾和错误的定义。

在我看来,宽列和列族数据库本质上是一回事。他们是

  1. 数据由一组键值对(每个称为列)在逻辑上组织;
  2. 由唯一的行键标识;
  3. 每行可以有可变的长度或列的定义和
  4. 一个接一个地存储在磁盘上。所以列族(宽列)表类似于关系数据库的表,因为它们仍然按行组织。

主要区别在于它们没有固定的列模式,并且显然不能进行表连接。

3 行(列族)的示例:每行具有不同的长度和/或列。但在磁盘上rowkey1的整个内容是一条连续的行,后面是类似于关系数据库的其他行

rowkey1 k1-v k2-v k3-v

rowkey2 k1-v k4v

rowkey3 k2-v k4-v k5-v

另一方面,术语 columnar DB 是相同的面向列的 DB。它们一次存储一列,而不是一次存储在磁盘上。它非常适合时间序列或任何多序列分析目的。每列具有相同类型的数据并存储在一起的事实允许更好的数据压缩作为额外的好处。

一个例子:

在此处输入图像描述

在磁盘上:

a:1 b:2 c:3 d:4

10:1 9:2 8:3 7:4

0 投票
1 回答
141 浏览

cassandra - 如何确定 cassandra 中的逻辑/物理读写?

我目前正在调查对 cassandra 的读写操作。我想知道 cassandra 对 memtable 和 sstable 执行的读写操作。cassandra 指标的最接近值是多少?我发现的只是延迟指标,但这不是我要寻找的。

我更想知道发生了多少次真正的读写来为一些特定的操作建立一个抽象的成本模型。

谢谢!

编辑:

所以看起来 ReadLatency 和 WriteLatency (Table Metrics) 是我一直在寻找的。但是,如果我想读取指标,则读取计数始终为 0。

我的设置:

  • 流行音乐!20.04 / 联想 P1 G2(512GB nvme SSD,16GB 内存)
  • Cassandra 3.11.7(Docker 容器)
  • Datastax 4.5.1 Java 驱动程序
  • 通过 Nodetools(一直在使用 docker 容器内的可执行文件)或 Telegraf 1.15.2 + Jolokina 1.6.2 收集指标

我的电报配置:

通过我的 Java 应用程序运行查询时,两者都在我的表上显示读取计数为零(写入计数器按预期递增),如下所示:

为什么读取计数器不增加?

0 投票
1 回答
942 浏览

java - 为什么我们需要 Hbase 中的列族?

有列族的原因是什么?例子:

方案 1:

方案 2:

在场景一中,虽然一个表可以有很多列族,但是所有的列族都是分开存储的。那为什么本身就有列族的概念呢?为什么不能有简单的场景2?同样对于场景 2,我不会阻止 HBase 提供的任何功能。您仍然可以稍后添加动态列(和其他功能)。

我唯一担心的是,如果列族是分开存储的,那么为什么它们在同一个表中?我只对拥有列族的意图(以及它解决了什么问题)感兴趣?

0 投票
1 回答
86 浏览

nosql - nosql 数据库类型的真实世界用例

可以请有人帮助我使用每种 nosql 数据库类型的真实世界应用程序吗?

(图、键值存储、列族、文档)

提前致谢!

0 投票
2 回答
142 浏览

rocksdb - 在 RocksDB 中查询列族的大小

有没有办法知道存储在列族中的所有 KV 的大小?

0 投票
1 回答
53 浏览

liquibase - 如何使用 cockroachdb 列族与 Liquidbase

为了更有效地管理列更新,cockroach db 具有家族特性:https ://www.cockroachlabs.com/docs/stable/column-families.html

是否有任何描述 liquibase 脚本来创建具有两个或多个家族的表?

就像是

0 投票
1 回答
18 浏览

count - 如何获取HBASE中每个列族中的列数

如何获取 HBASE 中每个列族中的列数。

我有一个 table_name T,columnfamily 'f' 和 'm',每个有 10 列。如何计算每个列族中的列数。

0 投票
1 回答
13 浏览

database - 有没有办法从 RocksDb 中的“ColumnFamilyName”中检索“ColumnFamilyHandle”?

或者,有没有办法ColumnFamilyHandles从数据库中获取所有当前打开的文件?

我知道静态函数RocksDB.listColumnFamilies。但这会返回一个List<byte[]> List containing the column family names. 不知道有没有办法ColumnFamilyHandle从这里过去。

0 投票
0 回答
17 浏览

cassandra - 列式/面向列的数据库与宽列/列族数据库

最近我对 Cassandra 感到非常困惑,因为大多数在线资料甚至 AWS 和 Google 都将其描述为柱状数据库。但实际上它是基于行的分区数据库。现在一切对我来说都是有意义的:那么所有特征都是

  1. 针对外来连接进行了优化
  2. 聚合多行几列/单列聚合
  3. 仅逐列扫描,而不是基于行的数据库

对于 Cassandra AKA 宽列/列族数据库仍然有效或正确。如果不是,它们的真正特征是什么?写性能?另外,我真的需要一个真正的列式数据库示例来研究?(与 Ca​​ssandra 不同,数据存储在不同的列块中)有人可以帮忙吗?困扰了我很久。提前致谢! 在此处输入图像描述