问题标签 [pycassa]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

122 问题

0 投票

1 回答

238 浏览

python - pycassa - 通过二级索引删除多行？

我有一个带有二级索引“指针”的列族。如何删除具有相同“指针”值（例如 abc）的多行？

我知道的唯一选择是：

但我知道这是非常低效的，如果我有数千行具有相同的“指针”值，可能需要很长时间。还有其他选择吗？

2012-12-22T11:53:25.897

0 投票

5 回答

2656 浏览

python - 用 pycassa 读取 Cassandra 1.2 表

使用 Cassandra 1.2。我通过以下方式使用 CQL 3 创建了一个表：

现在我正在尝试通过pycassa查询数据：

这给了我

如何实现？

python cassandra pycassa

2013-01-06T18:25:01.857

0 投票

2 回答

185 浏览

nosql - Cassandra - 使用返回 0 结果的键获取 CF，但使用 pycassa 检索整个表时存在键

我们在 Cassandra 1.2.0 中有一张桌子。那有一个 VarInt 键。当我们搜索键时，我们可以看到它们存在。

表说明：

钥匙

12040911

60619595

3220132

4602232

3997404

6312372

1128185

1507755

1778092

4701841

当我尝试获取键 60619595 的行时，它工作正常。

cqlsh:users> select key from u where key = 60619595;

钥匙

60619595

当我使用 pycassa 获取整个表时，我可以访问该行。

返回正确的结果。

我究竟做错了什么？我看不出错误是什么。

任何帮助，将不胜感激，

问候

迈克尔。

PS：当我尝试时，我应该在 pycassa 中这么说：

文件“test.py”，第 10 行，在 userscf.get(3997404) 文件“/usr/local/lib/python2.7/dist-packages/pycassa/columnfamily.py”，第 655 行，在 get raise NotFoundException() pycassa.cassandra.ttypes.NotFoundException: NotFoundException(_message=None)

它似乎在小于平均值的整数中。

nosql cassandra pycassa

2013-02-22T17:38:43.860

0 投票

1 回答

146 浏览

python - 是否可以使用 pycassa 对 cassandra 中的分布式计数器数据进行切片和切块？

我阅读并搜索了很多内容，但找不到根据条件对计数器数据进行切片的方法。Cassandra有办法做到这一点吗？如果是，请轻松帮助我。例如：如果我使用计数器来存储总页面浏览量，有什么方法可以获取特定页面 url 的页面浏览量或获取特定日期的所有页面浏览量？

提前致谢！

python cassandra pycassa

2013-03-01T11:44:32.707

0 投票

1 回答

1153 浏览

cassandra - 更新 cassandra 中的 TimeUUID 列

我正在尝试在以下列系列中存储一些时间序列数据：

我以这种方式成功插入数据：

如您所见，使用 datetime 对象作为列名 pycassa 可以正确转换为 timeUUID 对象。

有时，应用程序需要更新一些数据。问题是当我尝试更新该列时，传递相同的 datetime 对象，pycassa 创建一个不同的 UUID 对象（时间部分是相同的），所以它不是更新列，而是创建另一个。

问题是，如何使用传递 datetime 对象的 pycassa 更新基于 TimeUUID 的列？或者，如果这不是正确的方法，推荐的方法是什么？

cassandra pycassa timeuuid

2013-03-04T19:38:47.750

0 投票

1 回答

125 浏览

cassandra - 在创建列族之前可以使用 pycassaShell 转储 DDL 吗？

PycassaShell 使用 SYSTEM_MANAGER.create_column_family() 在 Cassandra 中创建列族。

有没有办法在 Cassandra 中提交之前转储 DDL？我必须修改 pycassaShell 内部吗？

cassandra pycassa

2013-03-05T18:00:23.987

0 投票

1 回答

359 浏览

cassandra - 如何使用 pycassa get_range 以反向排序顺序获取行？

我想让 pycassa 中的 get_range 返回的行处于反向排序顺序..即从完成到开始。我知道存在一个参数 column_reversed 用于以反向排序顺序获取列，但是我如何为行完成此操作？

cassandra pycassa

2013-03-08T00:21:52.107

0 投票

0 回答

76 浏览

cassandra - Cassandra中的几个非主键列，以及使用Pycassa

我的要求是有一个如下的列族：

我认为COMPACT STORAGE不允许这样做。另外，我想使用 pycassa。有什么方法可以实现上述使用Cassandra 1.2和Pycassa?

cassandra pycassa

2013-03-08T06:11:49.803

0 投票

1 回答

441 浏览

cassandra - Cassandra 插入在集群上受到限制

我在使用 Cassandra 时遇到了一个奇怪的问题。我的理解是 Cassandra 对于插入是可扩展的。这意味着如果我使用 2 个服务器的集群获得 1500 次写入/秒，我可以将其增加到 4 台服务器并接近 1500 次写入/秒。我知道 writes/s 可能不会随着集群中的节点数量线性增加，但我目前看到添加更多节点时 writes/s 的数量没有增加。

我目前的设置是这样的：

使用 Pycassa 批量插入，批量大小为 20 行。复制因子为 2 持久写入

一些 ColumnFamilies 有普通的列，一些有高达几十万列的宽列。具有宽列的 ColumnFamilies 的插入是分批插入的，而不是 100,000 列的 20 行。

cassandra 集群是托管在 EC2 中的 2 节点集群，使用 m1.xlarge 和 SSD 驱动器（无 raid），提交日志与 sstables 位于同一驱动器上。

我尝试将集群扩展到 10 多个节点，并且获得与 2 个节点相同的性能。我还尝试增加导入数据的实例数量，性能是相同的，只是每次写入操作的延迟要高得多。但无论我做什么，我都无法让写入速度超过 1500/s。

cassandra pycassa

2013-03-25T17:03:30.593

0 投票

1 回答

2255 浏览

cassandra - Python 的最佳 Cassandra 1.2 驱动程序，我应该忘记 CQL 吗？

我正在为 python 寻找一个好的驱动程序：

1）皮卡萨。它不支持 CQL，他们不认为很快就会这样做。

2) https://code.google.com/a/apache-extras.org/p/cassandra-dbapi2/。

我想使用 cassandra-dbapi2 但这里有人说“它不支持连接池负载平衡高级功能”。另一方面，我可以使用 PyCassa，但它不支持 CQL。我应该尝试 Pycassa 并忘记客户端上的 CQL 吗？

我不在乎失去 ORM 功能，实际上我认为有时可能会更糟，因为它迫使您的团队学习新事物（您正在使用的 ORM API 上的新功能），而 SQL 是人们知道的东西。既然已经了解 SQL/CQL，为什么还要学习一门新语言？但这只是一个意见...

你认为最好的选择是什么？我应该忘记 CQL 吗？

cassandra pycassa

2013-03-31T15:03:02.880

1 2 3 4 5 6 7 8 9 10

问题标签 [pycassa]

Reference