问题标签 [column-family]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
cassandra - cassandra:不一致的列族
取自http://www.ibm.com/developerworks/library/os-apache-cassandra/中的示例。假设我们涉及两个实体:书籍和标签。一本书有多个标签,所以它们之间的关系是1:M。
根据文章,我们应该创建两个列族:Books
和Tags2BooksIndex
. 前者存储关于一本书的所有信息(包括它的所有标签),而后者是一个从标签映射到书籍的索引,因此对于给定的标签,我们可以快速找到所有具有该标签的书。所有这些看起来都很好。但我有一个问题:
考虑如何将新书添加到数据库:(1)将新行追加到列族Books
中,(2)更新Tags2BooksIndex
以将新书添加到与该书关联的所有标签行。
假设在我们完成步骤 (1) 后 2 秒,新书行已被复制到它应该去的所有节点,并且步骤 (2) 仍在进行中。现在如果我从这个新书行中读取books
一个标签,然后使用这个标签来检查Tags2BooksIndex
,可能会出现我找不到新书的情况,Tags2BooksIndex
因为它还没有完全更新,或者更新还没有已复制到所有副本节点。
如何处理这样的情况?将 2 秒替换为 2 毫秒,我们仍然有一个不一致的时间窗口。我想知道处理这种情况的“正确/实用”方法。
cassandra - cassandra 从两个不同的键空间将数据从一个列族复制到另一个列族
我是卡桑德拉的新手。有没有办法将数据从一个列族从一个键空间复制到另一个键空间?
我们有一个应用程序,它生成相同列族的新键空间。我们正在考虑将所有这些合并到每个租户的一个键空间中。
有任何可用的命令或实用程序来执行此操作吗?
提前致谢。
hbase - 在 hbase 中拥有更多列族的缺点?
我已经在 hbase 中读过,我在一个表中不应该有超过 2-3 个列族。我知道要连续从每个列族中获取条目,我需要进行单独的扫描,但我仍然不明白如果我有更多的列族会出现什么问题。?
在我的情况下,我想在 hbase 中存储 20 个大约 10 KB 的图像,每个图像具有不同的维度(mxn)。因此,通常会有一个请求来获取特定维度,我需要提供该图像。因此,如果我将所有这些图像放在单列族中,则所有 20 个不同维度的图像都将不必要地加载到内存中进行缓存(如果请求再次针对同一图像,则肯定它会针对同一维度)。另一方面,如果我将保留 20 个列族(每个维度一个),则只有所需的图像会被加载到 RAM 中进行缓存。
hbase - 如何向现有 HBase 表添加新列族?
我创建了一个表
现在可以添加另一个列族“columnfamily2”吗?方法是什么?
hbase - 如何获取 HBase 表的列族和限定符
我想使用以下内容:
但它返回给我一个空列表,因为我没有指定正确的列族和/或正确的限定符。
对于我的源表,如何查看所有列族和限定符?
我还没有创建 HBase 表,它已经可用。
csv - 如何在 Cassandra 中加入多个数据源
我是第一次与 Cassandra 合作,我有一些疑问。我的数据源是 csv 文件。我有三个:航班、飞机和机场。我将把每个 csv 文件的结构放在上下文中来说明我的问题。
飞机场
ID_机场 | 机场| 城市| 状态 | 国家 | 纬度 | 经度
飞机
ID_airplane |type |制造商 |issue_date |model |engine_type |aircraft_type
航班
ID_flight |日期 |Flight_Numb |ID_airplane |ID_airport_origin |ID_airport_dest
DepartureTime |Arrival_time |航空公司|距离|DepDelay |ArrivalDelay。
航班文件是主要文件,有数百万条记录。另外两个是补充数据。
根据我读到的关于 Cassandra 的内容,首先应该定义必要的查询,然后创建满足我们需求的列族。然而 Cassandra 不支持 JOIN 的。如何将 csv 文件中的数据与另一个文件关联,以便创建具有不同 csv 文件字段的列族?
例如,如果我想知道哪种机型的航班延误较多。在关系模型中,这是可能的,但在 Cassandra 中我认为这是不可能的。
有什么办法可以在 Cassadra 中做到这一点?如何拥有具有不同 csv 文件字段的列族?
hbase - 如何在不添加列族的情况下在 hbase 表中添加列
是否可以在不添加列族的情况下创建 hbase 表,例如 create 'emp','personal data','professional data'
个人数据和专业数据是列族,我想在不添加列族的情况下向表中添加字段
例如
filter - 如何跳过缺少特定列族的 HBase 行?
例如,一个 HBase 表有 columnFamilyA、columnFamilyB 和 columnFamilyC,对于某些行,columnFamilyA 中没有任何列。我想扫描表格并仅返回 columnFamilyA 中至少包含一列的行。
我应该使用哪种过滤器?我检查了 SingleColumnValueFilter,但它似乎只适用于除 columnFamily 之外的特定列。我需要 columnFamiliyA 包含至少一列的所有行。不仅仅是 columnFamiliyA 中的数据,而是整行。
cassandra - 我们如何在 Cassandra 中对复杂的数据模型进行 CRUD 操作?
我们如何对复杂的数据模型进行 CRUD 操作Cassandra
?
- 我有一个使用 NOSQL 的项目。
- 我有一个供我的客户使用的列族。
- 列族起初只有“id”。
- 然后它将通过更改新列来更新。
- 每个客户的列数和类型可能不同。
- 此外,每一列都可以再次包含带有 id 的子列,并且它也会被更改。所以,它们应该被索引。文件对这个问题没有用。
我读过关于 NOSQL 的文章,我决定使用Cassandra
. 如果您能回答以下问题,我将不胜感激:
以上可能吗?
我们如何
CRUD
在这个列族上创建和使用操作?如果最后一个问题的答案为真,那么查询的结果类型是什么?
它会为每个主键(id)返回一些行吗?
我们如何管理它,以访问没有冗余的表?因为我现在不应该在 DBside 或代码端管理这个总结。
谢谢您的帮助。
hbase - 如何在不定义 apache phoenix 中的任何列的情况下创建列族?
根据凤凰官网的描述:
在创建表 DDL 之后将创建两列故障 A 和 B。
但是我需要创建一个列族而不定义任何列,因此属于该列族的所有列都是动态的。除了为列族创建一个虚拟列之外,有什么办法吗?