问题标签 [pycassa]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
238 浏览

python - pycassa - 通过二级索引删除多行?

我有一个带有二级索引“指针”的列族。如何删除具有相同“指针”值(例如 abc)的多行?

我知道的唯一选择是:

但我知道这是非常低效的,如果我有数千行具有相同的“指针”值,可能需要很长时间。还有其他选择吗?

0 投票
5 回答
2656 浏览

python - 用 pycassa 读取 Cassandra 1.2 表

使用 Cassandra 1.2。我通过以下方式使用 CQL 3 创建了一个表:

现在我正在尝试通过pycassa查询数据:

这给了我

如何实现?

0 投票
2 回答
185 浏览

nosql - Cassandra - 使用返回 0 结果的键获取 CF,但使用 pycassa 检索整个表时存在键

我们在 Cassandra 1.2.0 中有一张桌子。那有一个 VarInt 键。当我们搜索键时,我们可以看到它们存在。

表说明:

钥匙

12040911

60619595

3220132

4602232

3997404

6312372

1128185

1507755

1778092

4701841

当我尝试获取键 60619595 的行时,它工作正常。

cqlsh:users> select key from u where key = 60619595;

钥匙

60619595

当我使用 pycassa 获取整个表时,我可以访问该行。

返回正确的结果。

我究竟做错了什么?我看不出错误是什么。

任何帮助,将不胜感激,

问候

迈克尔。

PS:当我尝试时,我应该在 pycassa 中这么说:

文件“test.py”,第 10 行,在 userscf.get(3997404) 文件“/usr/local/lib/python2.7/dist-packages/pycassa/columnfamily.py”,第 655 行,在 get raise NotFoundException() pycassa.cassandra.ttypes.NotFoundException: NotFoundException(_message=None)

它似乎在小于平均值的整数中。

0 投票
1 回答
146 浏览

python - 是否可以使用 pycassa 对 cassandra 中的分布式计数器数据进行切片和切块?

我阅读并搜索了很多内容,但找不到根据条件对计数器数据进行切片的方法。Cassandra有办法做到这一点吗?如果是,请轻松帮助我。例如:如果我使用计数器来存储总页面浏览量,有什么方法可以获取特定页面 url 的页面浏览量或获取特定日期的所有页面浏览量?

提前致谢!

0 投票
1 回答
1153 浏览

cassandra - 更新 cassandra 中的 TimeUUID 列

我正在尝试在以下列系列中存储一些时间序列数据:

我以这种方式成功插入数据:

如您所见,使用 datetime 对象作为列名 pycassa 可以正确转换为 timeUUID 对象。

有时,应用程序需要更新一些数据。问题是当我尝试更新该列时,传递相同的 datetime 对象,pycassa 创建一个不同的 UUID 对象(时间部分是相同的),所以它不是更新列,而是创建另一个。

问题是,如何使用传递 datetime 对象的 pycassa 更新基于 TimeUUID 的列?或者,如果这不是正确的方法,推荐的方法是什么?

0 投票
1 回答
125 浏览

cassandra - 在创建列族之前可以使用 pycassaShell 转储 DDL 吗?

PycassaShell 使用 SYSTEM_MANAGER.create_column_family() 在 Cassandra 中创建列族。

有没有办法在 Cassandra 中提交之前转储 DDL?我必须修改 pycassaShell 内部吗?

0 投票
1 回答
359 浏览

cassandra - 如何使用 pycassa get_range 以反向排序顺序获取行?

我想让 pycassa 中的 get_range 返回的行处于反向排序顺序..即从完成到开始。我知道存在一个参数 column_reversed 用于以反向排序顺序获取列,但是我如何为行完成此操作?

0 投票
0 回答
76 浏览

cassandra - Cassandra中的几个非主键列,以及使用Pycassa

我的要求是有一个如下的列族:

我认为COMPACT STORAGE不允许这样做。另外,我想使用 pycassa。有什么方法可以实现上述使用Cassandra 1.2Pycassa?

0 投票
1 回答
441 浏览

cassandra - Cassandra 插入在集群上受到限制

我在使用 Cassandra 时遇到了一个奇怪的问题。我的理解是 Cassandra 对于插入是可扩展的。这意味着如果我使用 2 个服务器的集群获得 1500 次写入/秒,我可以将其增加到 4 台服务器并接近 1500 次写入/秒。我知道 writes/s 可能不会随着集群中的节点数量线性增加,但我目前看到添加更多节点时 writes/s 的数量没有增加。

我目前的设置是这样的:

使用 Pycassa 批量插入,批量大小为 20 行。复制因子为 2 持久写入

一些 ColumnFamilies 有普通的列,一些有高达几十万列的宽列。具有宽列的 ColumnFamilies 的插入是分批插入的,而不是 100,000 列的 20 行。

cassandra 集群是托管在 EC2 中的 2 节点集群,使用 m1.xlarge 和 SSD 驱动器(无 raid),提交日志与 sstables 位于同一驱动器上。

我尝试将集群扩展到 10 多个节点,并且获得与 2 个节点相同的性能。我还尝试增加导入数据的实例数量,性能是相同的,只是每次写入操作的延迟要高得多。但无论我做什么,我都无法让写入速度超过 1500/s。

0 投票
1 回答
2255 浏览

cassandra - Python 的最佳 Cassandra 1.2 驱动程序,我应该忘记 CQL 吗?

我正在为 python 寻找一个好的驱动程序:

1)皮卡萨。它不支持 CQL,他们不认为很快就会这样做。

2) https://code.google.com/a/apache-extras.org/p/cassandra-dbapi2/

我想使用 cassandra-dbapi2 但这里有人说“它不支持连接池负载平衡高级功能”。另一方面,我可以使用 PyCassa,但它不支持 CQL。我应该尝试 Pycassa 并忘记客户端上的 CQL 吗?

我不在乎失去 ORM 功能,实际上我认为有时可能会更糟,因为它迫使您的团队学习新事物(您正在使用的 ORM API 上的新功能),而 SQL 是人们知道的东西。既然已经了解 SQL/CQL,为什么还要学习一门新语言?但这只是一个意见...

你认为最好的选择是什么?我应该忘记 CQL 吗?