问题标签 [column-family]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
1177 浏览

python - 连续执行调用 (CQL) 上的未配置列族错误

我正在为 datastax 的发行版使用cassandra python 驱动程序。麻麻编码...

失败:

通过:

错误:

只要我自上次 session.execute 调用以来“重置”了键空间,连续的 session.execute 调用就可以工作。我不应该在每次 session.execute 调用后重置它。

想法?(我已经在github提交了issue,收到回复后会更新)

0 投票
1 回答
119 浏览

database-design - 我的项目的 NoSQL (cassandra) 数据模型

我需要您对我为我的项目设计的数据模型提出意见。我的项目是实时推荐系统。有一些推荐算法的集合。它的意思是这样的:

集合1 {算法1,算法5,算法6}

集合2 {算法5,算法6,算法7,算法8}

等等

我需要将成功、选择概率、得分等数据存储到收集中的每个算法(每 2 分钟)。所以我选择了 Cassandra 作为我的数据存储,因为它适用于时间序列。我需要存储我的数据,以便稍后在某些图形和图表中显示。您认为我的数据模型解决方案可以吗?我是这样做的:

因此,它的设计类似于行分区,通过向行键添加数据来限制集合中每个算法的列数(按日期)。

你怎么看待这件事?谢谢,扬

0 投票
3 回答
1122 浏览

cassandra - 限制请求结果的数量时,Cassandra 是否会读取整行?

我正在使用 cassandra 2.0.6。并有这张桌子:

所以说我得到了这些行:

....继续说 1000 行 x

如果我查询:

cassandra 会获取所有 1000 行,还是只获取其中的一小部分?

阅读诸如http://www.ebaytechblog.com/2012/08/14/cassandra-data-modeling-best-practices-part-2/#.UzrvLKZx2PI之类的文章,似乎它只会获取其中的一小部分。但是运行一些压力测试并且我在表中拥有的数据越多,我得到的 MB/sec 磁盘 IO 就越多。

对于 8GB 数据,我获得 3MB/秒 IO(读取) 对于 12GB 数据,我获得 15MB/秒 IO(读取) 对于 20GB 数据,我目前获得 35MB/秒 IO(读取)

我在 cfhistograms 中没有看到任何奇怪的东西:

0 投票
2 回答
1101 浏览

java - 如何从具有多个行键的 cassandra 中的计数器列中获取值?

我有一个具有多个计数器列的列族。现在我想代表不同的行键获取它们的值,例如 RangeSlicesQuery 或 MultigetSliceQuery,我想应用于计数器列,请在计数器列中给我让路。

0 投票
2 回答
7132 浏览

versioning - 哪些 NoSQL 数据库(类别)支持版本控制?

我认为无论 NoSQL 聚合存储是键值、列族还是文档数据库,它都会支持值的版本控制。经过一番谷歌搜索,我得出的结论是这个假设是错误的,它只取决于 DBMS 的实现。这是真的?

我知道 Cassandra 和 BigTable 支持它(都是列族商店)。似乎 Hbase(列族)和 Riak(键值)可以,但 Redis 和 Hadoop(键值)没有。Mongo DB(文档)会做Couchbase,但 MongoDB 不会(文档存储)。我在这里看不到任何模式。有经验法则吗?(例如,“键值存储通常没有版本控制,而列族和文档数据库有”)

我正在尝试做的事情:我想创建一个从 URL 到 PNG 图像的网站截图数据库。我宁愿使用键值存储,因为除了版本控制之外,它是解决问题的最简单的解决方案。但是当网站更改或停用并且我更新我的数据库时,我不想丢失旧图像。即使我选择了一个具有版本控制的键值数据库,我也希望能够切换到不同的键值数据库,而不受许多键值数据库不支持版本控制的约束。因此,我试图了解在聚合 NoSQL 数据库的连续统一体中,版本控制在何种复杂程度成为数据模型隐含的功能。

0 投票
1 回答
463 浏览

hbase - 如何在 HBase 中的选定集群中创建列族

在 cassandra hector API 中,允许在选定的集群上创建表,如下所示。我想用 HBase 做同样的事情,有人可以帮我吗?

这是使用 Cassandra 完成的方式:

0 投票
3 回答
1780 浏览

copy - 如何将 cassandra 数据从一个集群复制到另一个集群

我有 2 个 cassandra 集群,位于不同的数据中心(请注意,这些是 2 个不同的集群,而不是具有 multidc 的单个集群),并且两个集群具有相同的键空间和列族模型。我希望以最有效的方式将列族 C 的数据从集群 A 复制到集群 B。其他一些 ColumnFamily 我可以使用 get 和 put 操作进行复制,因为它是一个时间序列并且键是顺序的。但是这个其他列族 C,我可以复制。我正在使用节俭和 pycassa。我已经尝试了 CQL COPY 命令,但不幸的是 CF 太大了,我得到了一个 rpc_timeout。我怎样才能做到这一点?

0 投票
2 回答
1065 浏览

hbase - 为什么 HBase 需要为每个 Value 存储 Column Family?

因为 HBase 表是稀疏表,所以 HBase 不仅为每个单元存储值,还存储识别单元所需的所有信息(通常描述为 Key,不要与 RowKey 混淆)。密钥如下所示:

RowKey-ColumnFamily-ColumnQualifier-时间戳

所有这些信息都存储在每个条目中。这就是为什么建议使用 Column Families 和 Column Qualifiers 的短名称来减少额外开销的原因。

我的问题:为什么我需要为每个条目存储 ColumnFamily?据我了解,每个存储文件都属于一个列族。每个存储文件存储一次列族名称还不够吗?这将减少开销,可以使用任意列族名称,并且我们仍然能够识别每个条目的列族。我在这里想念什么?

0 投票
1 回答
353 浏览

cassandra - 了解在 Cassandra 键空间中插入列族的代码?

我正在阅读Cassandra- The definitive guide by E.Hewitt。我在第四章,作者描述了示例酒店应用程序的代码。本书中的图片在此提供以供参考。 在此处输入图像描述

这是插入HotelByCityrowkeys的方法column Family

我很难遵循代码。尤其是为什么要创建这么多容器(地图)。Mutation对象等的目的是什么?行键到底是如何插入的?

如果你能解释一下代码的每一步发生了什么,那就太好了。这本书没有解释,我无法了解这是如何完成的。

PS:我是一名Java开发人员。所以我熟悉什么地图等。但我只是不明白为什么地图被塞进另一个地图和其他细节

谢谢

0 投票
0 回答
2861 浏览

cassandra - 定期收到“InvalidQueryException:未配置的 columnfamily 文档”

我们有一个应用程序,它基本上每 1 分钟定期轮询一次更改,使用 Datastax c* 驱动程序 2.0.4(也尝试过 2.1.0-beta1)。

我们在应用启动时创建一个Session,指定keyspace,例如Session session = cluster.connect("my_keyspace");

然后使用 Timer 每分钟执行以下选择:

然后:

这似乎工作正常,除了每 6 分钟我看到一个异常指示“未配置的列族文档”

我已经看到一些关于键空间的引用,涉及在不同的客户端中错误地指定它们,或者使用需要引号的大写字符等,但与我们所经历的完全不同。我被这个异常的频率与计时器的频率不匹配,但仍然可以预测每 6 次迭代发生一次。

我发现的最接近的是这个未回答的问题:连续执行调用中未配置的列族错误(CQL)

感谢您的任何建议