问题标签 [column-family]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
73 浏览

cassandra - cassandra:不一致的列族

取自http://www.ibm.com/developerworks/library/os-apache-cassandra/中的示例。假设我们涉及两个实体:书籍和标签。一本书有多个标签,所以它们之间的关系是1:M。

根据文章,我们应该创建两个列族:BooksTags2BooksIndex. 前者存储关于一本书的所有信息(包括它的所有标签),而后者是一个从标签映射到书籍的索引,因此对于给定的标签,我们可以快速找到所有具有该标签的书。所有这些看起来都很好。但我有一个问题:

考虑如何将新书添加到数据库:(1)将新行追加到列族Books中,(2)更新Tags2BooksIndex以将新书添加到与该书关联的所有标签行。

假设在我们完成步骤 (1) 后 2 秒,新书行已被复制到它应该去的所有节点,并且步骤 (2) 仍在进行中。现在如果我从这个新书行中读取books一个标签,然后使用这个标签来检查Tags2BooksIndex,可能会出现我找不到新书的情况,Tags2BooksIndex因为它还没有完全更新,或者更新还没有已复制到所有副本节点。

如何处理这样的情况?将 2 秒替换为 2 毫秒,我们仍然有一个不一致的时间窗口。我想知道处理这种情况的“正确/实用”方法。

0 投票
1 回答
555 浏览

cassandra - cassandra 从两个不同的键空间将数据从一个列族复制到另一个列族

我是卡桑德拉的新手。有没有办法将数据从一个列族从一个键空间复制到另一个键空间?

我们有一个应用程序,它生成相同列族的新键空间。我们正在考虑将所有这些合并到每个租户的一个键空间中。

有任何可用的命令或实用程序来执行此操作吗?

提前致谢。

0 投票
1 回答
626 浏览

hbase - 在 hbase 中拥有更多列族的缺点?

我已经在 hbase 中读过,我在一个表中不应该有超过 2-3 个列族。我知道要连续从每个列族中获取条目,我需要进行单独的扫描,但我仍然不明白如果我有更多的列族会出现什么问题。?

在我的情况下,我想在 hbase 中存储 20 个大约 10 KB 的图像,每个图像具有不同的维度(mxn)。因此,通常会有一个请求来获取特定维度,我需要提供该图像。因此,如果我将所有这些图像放在单列族中,则所有 20 个不同维度的图像都将不必要地加载到内存中进行缓存(如果请求再次针对同一图像,则肯定它会针对同一维度)。另一方面,如果我将保留 20 个列族(每个维度一个),则只有所需的图像会被加载到 RAM 中进行缓存。

0 投票
3 回答
30260 浏览

hbase - 如何向现有 HBase 表添加新列族?

我创建了一个表

现在可以添加另一个列族“columnfamily2”吗?方法是什么?

0 投票
1 回答
2672 浏览

hbase - 如何获取 HBase 表的列族和限定符

我想使用以下内容:

但它返回给我一个空列表,因为我没有指定正确的列族和/或正确的限定符。

对于我的源表,如何查看所有列族和限定符?

我还没有创建 HBase 表,它已经可用。

0 投票
0 回答
158 浏览

csv - 如何在 Cassandra 中加入多个数据源

我是第一次与 Cassandra 合作,我有一些疑问。我的数据源是 csv 文件。我有三个:航班、飞机和机场。我将把每个 csv 文件的结构放在上下文中来说明我的问题。

飞机场

ID_机场 | 机场| 城市| 状态 | 国家 | 纬度 | 经度

飞机

ID_airplane |type |制造商 |issue_date |model |engine_type |aircraft_type

航班

ID_flight |日期 |Flight_Numb |ID_airplane |ID_airport_origin |ID_airport_dest

DepartureTime |Arrival_time |航空公司|距离|DepDelay |ArrivalDelay。

航班文件是主要文件,有数百万条记录。另外两个是补充数据。

根据我读到的关于 Cassandra 的内容,首先应该定义必要的查询,然后创建满足我们需求的列族。然而 Cassandra 不支持 JOIN 的。如何将 csv 文件中的数据与另一个文件关联,以便创建具有不同 csv 文件字段的列族?

例如,如果我想知道哪种机型的航班延误较多。在关系模型中,这是可能的,但在 Cassandra 中我认为这是不可能的。

有什么办法可以在 Cassadra 中做到这一点?如何拥有具有不同 csv 文件字段的列族?

0 投票
1 回答
4719 浏览

hbase - 如何在不添加列族的情况下在 hbase 表中添加列

是否可以在不添加列族的情况下创建 hbase 表,例如 create 'emp','personal data','professional data'

个人数据和专业数据是列族,我想在不添加列族的情况下向表中添加字段

例如

0 投票
2 回答
335 浏览

filter - 如何跳过缺少特定列族的 HBase 行?

例如,一个 HBase 表有 columnFamilyA、columnFamilyB 和 columnFamilyC,对于某些行,columnFamilyA 中没有任何列。我想扫描表格并仅返回 columnFamilyA 中至少包含一列的行。

我应该使用哪种过滤器?我检查了 SingleColumnValueFilter,但它似乎只适用于除 columnFamily 之外的特定列。我需要 columnFamiliyA 包含至少一列的所有行。不仅仅是 columnFamiliyA 中的数据,而是整行。

0 投票
0 回答
86 浏览

cassandra - 我们如何在 Cassandra 中对复杂的数据模型进行 CRUD 操作?

我们如何对复杂的数据模型进行 CRUD 操作Cassandra

  • 我有一个使用 NOSQL 的项目。
  • 我有一个供我的客户使用的列族。
  • 列族起初只有“id”。
  • 然后它将通过更改新列来更新。
  • 每个客户的列数和类型可能不同。
  • 此外,每一列都可以再次包含带有 id 的子列,并且它也会被更改。所以,它们应该被索引。文件对这个问题没有用。

我读过关于 NOSQL 的文章,我决定使用Cassandra. 如果您能回答以下问题,我将不胜感激:

  1. 以上可能吗?

  2. 我们如何CRUD在这个列族上创建和使用操作?

  3. 如果最后一个问题的答案为真,那么查询的结果类型是什么?

  4. 它会为每个主键(id)返回一些行吗?

  5. 我们如何管理它,以访问没有冗余的表?因为我现在不应该在 DBside 或代码端管理这个总结。

谢谢您的帮助。

0 投票
1 回答
611 浏览

hbase - 如何在不定义 apache phoenix 中的任何列的情况下创建列族?

根据凤凰官网的描述:

在创建表 DDL 之后将创建两列故障 A 和 B。

但是我需要创建一个列族而不定义任何列,因此属于该列族的所有列都是动态的。除了为列族创建一个虚拟列之外,有什么办法吗?