问题标签 [pycassa]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - pycassa - 通过二级索引删除多行?
我有一个带有二级索引“指针”的列族。如何删除具有相同“指针”值(例如 abc)的多行?
我知道的唯一选择是:
但我知道这是非常低效的,如果我有数千行具有相同的“指针”值,可能需要很长时间。还有其他选择吗?
python - 用 pycassa 读取 Cassandra 1.2 表
使用 Cassandra 1.2。我通过以下方式使用 CQL 3 创建了一个表:
现在我正在尝试通过pycassa查询数据:
这给了我
如何实现?
nosql - Cassandra - 使用返回 0 结果的键获取 CF,但使用 pycassa 检索整个表时存在键
我们在 Cassandra 1.2.0 中有一张桌子。那有一个 VarInt 键。当我们搜索键时,我们可以看到它们存在。
表说明:
钥匙
12040911
60619595
3220132
4602232
3997404
6312372
1128185
1507755
1778092
4701841
当我尝试获取键 60619595 的行时,它工作正常。
cqlsh:users> select key from u where key = 60619595;
钥匙
60619595
当我使用 pycassa 获取整个表时,我可以访问该行。
返回正确的结果。
我究竟做错了什么?我看不出错误是什么。
任何帮助,将不胜感激,
问候
迈克尔。
PS:当我尝试时,我应该在 pycassa 中这么说:
文件“test.py”,第 10 行,在 userscf.get(3997404) 文件“/usr/local/lib/python2.7/dist-packages/pycassa/columnfamily.py”,第 655 行,在 get raise NotFoundException() pycassa.cassandra.ttypes.NotFoundException: NotFoundException(_message=None)
它似乎在小于平均值的整数中。
python - 是否可以使用 pycassa 对 cassandra 中的分布式计数器数据进行切片和切块?
我阅读并搜索了很多内容,但找不到根据条件对计数器数据进行切片的方法。Cassandra有办法做到这一点吗?如果是,请轻松帮助我。例如:如果我使用计数器来存储总页面浏览量,有什么方法可以获取特定页面 url 的页面浏览量或获取特定日期的所有页面浏览量?
提前致谢!
cassandra - 更新 cassandra 中的 TimeUUID 列
我正在尝试在以下列系列中存储一些时间序列数据:
我以这种方式成功插入数据:
如您所见,使用 datetime 对象作为列名 pycassa 可以正确转换为 timeUUID 对象。
有时,应用程序需要更新一些数据。问题是当我尝试更新该列时,传递相同的 datetime 对象,pycassa 创建一个不同的 UUID 对象(时间部分是相同的),所以它不是更新列,而是创建另一个。
问题是,如何使用传递 datetime 对象的 pycassa 更新基于 TimeUUID 的列?或者,如果这不是正确的方法,推荐的方法是什么?
cassandra - 在创建列族之前可以使用 pycassaShell 转储 DDL 吗?
PycassaShell 使用 SYSTEM_MANAGER.create_column_family() 在 Cassandra 中创建列族。
有没有办法在 Cassandra 中提交之前转储 DDL?我必须修改 pycassaShell 内部吗?
cassandra - 如何使用 pycassa get_range 以反向排序顺序获取行?
我想让 pycassa 中的 get_range 返回的行处于反向排序顺序..即从完成到开始。我知道存在一个参数 column_reversed 用于以反向排序顺序获取列,但是我如何为行完成此操作?
cassandra - Cassandra中的几个非主键列,以及使用Pycassa
我的要求是有一个如下的列族:
我认为COMPACT STORAGE
不允许这样做。另外,我想使用 pycassa。有什么方法可以实现上述使用Cassandra 1.2
和Pycassa?
cassandra - Cassandra 插入在集群上受到限制
我在使用 Cassandra 时遇到了一个奇怪的问题。我的理解是 Cassandra 对于插入是可扩展的。这意味着如果我使用 2 个服务器的集群获得 1500 次写入/秒,我可以将其增加到 4 台服务器并接近 1500 次写入/秒。我知道 writes/s 可能不会随着集群中的节点数量线性增加,但我目前看到添加更多节点时 writes/s 的数量没有增加。
我目前的设置是这样的:
使用 Pycassa 批量插入,批量大小为 20 行。复制因子为 2 持久写入
一些 ColumnFamilies 有普通的列,一些有高达几十万列的宽列。具有宽列的 ColumnFamilies 的插入是分批插入的,而不是 100,000 列的 20 行。
cassandra 集群是托管在 EC2 中的 2 节点集群,使用 m1.xlarge 和 SSD 驱动器(无 raid),提交日志与 sstables 位于同一驱动器上。
我尝试将集群扩展到 10 多个节点,并且获得与 2 个节点相同的性能。我还尝试增加导入数据的实例数量,性能是相同的,只是每次写入操作的延迟要高得多。但无论我做什么,我都无法让写入速度超过 1500/s。
cassandra - Python 的最佳 Cassandra 1.2 驱动程序,我应该忘记 CQL 吗?
我正在为 python 寻找一个好的驱动程序:
1)皮卡萨。它不支持 CQL,他们不认为很快就会这样做。
2) https://code.google.com/a/apache-extras.org/p/cassandra-dbapi2/。
我想使用 cassandra-dbapi2 但这里有人说“它不支持连接池负载平衡高级功能”。另一方面,我可以使用 PyCassa,但它不支持 CQL。我应该尝试 Pycassa 并忘记客户端上的 CQL 吗?
我不在乎失去 ORM 功能,实际上我认为有时可能会更糟,因为它迫使您的团队学习新事物(您正在使用的 ORM API 上的新功能),而 SQL 是人们知道的东西。既然已经了解 SQL/CQL,为什么还要学习一门新语言?但这只是一个意见...
你认为最好的选择是什么?我应该忘记 CQL 吗?