问题标签 [pycassa]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 如何使用 pycassa 获取存储在 Cassandra 列族中的所有键?
有没有人有使用pycassa的经验,我对此表示怀疑。如何获取存储在数据库中的所有密钥?
好吧,在这个小片段中,我们需要提供键以获取关联的列(这里的键是“foo”和“bar”),这很好,但我的要求是一次获取所有键(只有键)作为 Python 列表或类似的数据结构。
谢谢。
python - 在 Python 中为 Cassandra 生成 UUID
呵呵,我用
cf.insert(uuid.uuid1().bytes_le, {'column1': 'val1'})
(皮卡萨)
为 Cassandra 创建 TimeUUID,但出现错误
它不适用于
任何一个。
创建与 CompareWith="TimeUUIDType" 标志一起使用的有效 TimeUUID 的最佳方法是什么?
谢谢,
亨里克
java - 为 Django 设置 Cassandra -“ImportError:没有名为 pycassa 的模块”
我遵循了本指南:https ://github.com/ericflo/twissandra
Pycassa 已安装,包括所有依赖项。一切运行顺利,但运行python manage.py sync_cassandra
给出消息:
所以我运行 Python 交互式解释器并输入import pycassa
,该命令运行成功,没有错误。
跑步
将给出消息:
是site-packages
在列表中。但我有点困惑,因为这是在虚拟环境中
我不知道发生了什么以及该怎么办
django - Setup Cassandra for Django - "python manage.py sync_cassandra" or "sudo python manage.py sync_cassandra"
I'm following guide in https://github.com/thobbs/twissandra
I'm still stuck at:
python manage.py sync_cassandra
will generate
sudo python manage.py sync_cassandra
will generate
yes, that was errors..
But I'm a bit confuse, sudo
or not sudo
...python manage.py sync_cassandra
or sudo python manage.py sync_cassandra
django - 为 Django 设置 Cassandra -“AttributeError:'SystemManager' 对象没有属性 'describe_keyspace'”
我已按照https://github.com/thobbs/twissandra中的分步指南进行操作
我被困在python manage.py sync_cassandra
收到消息的地方:
我对此一无所知。该怎么办?
cassandra - 要知道在 Cassandra 中找不到哪个键?
我正在使用 pycassa。我正在请求一行中的一些列:
如果指定的行键或任何开始和结束列键不存在,则会引发 NotFoundException。有没有办法确定未找到哪个键 - 行键或列键(名称)?
python - 将 pycassa 与 uwsgi 一起使用时的问题
我们将 pycassa 与 uwsgi 一起使用。大约有 16 个 uwsgi 进程。
奇怪的是,一个进程可以得到另一个进程查询的数据。例如,列族 A 中有一行,如下所示:
{row_key, {'column_a': 1, 'column_b': 2}}
进程 1 运行:get(row_key, columns=['column_a', ])
进程 2 运行:get(row_key, columns=['column_b', ])
但是,有时,进程 1 得到 column_b 的值,进程 2 得到 column_a 的值。
这是连接池的已知问题吗?
任何回应表示赞赏。
benchmarking - 使用 pycassa 进行压力测试
我一直在尝试为相当大的 cassandra 数据库编写压力测试器。起初我是从头开始做的,然后我发现了stress.py,它可以让你对你的集群进行压力测试。但是,与所有基准测试一样,测试数据不代表该数据库将看到的负载。因此,我决定对其进行修改,使其更符合我的使用模式。
我在这个项目的大部分时间都使用 pycassa。但是stress.py 直接使用了底层的thrift 接口,我觉得这很麻烦。有没有使用 pycassa 对 cassandra 进行压力测试的项目?谢谢!
cassandra - Cassandra 多获取性能
我有一个 cassandra 集群,其行数相当少(200 万左右,我希望这对于 cassandra 来说是“小”)。每行都以唯一的 UUID 为键,每行大约有 200 列(给或取几列)。总而言之,这些都是非常小的行,没有二进制数据或大量文本。只是短字符串。
我刚刚完成了从旧数据库到 cassandra 集群的初始导入。我已经在每台机器上调整了 cassandra。有数亿次写入,但没有读取。现在是时候使用这个东西了,我发现读取速度绝对令人沮丧。我正在一次使用 pycassa 在 500 到 10000 行的任何地方进行 multiget。即使在 500 行时,性能也很糟糕,有时需要 30 多秒。
什么会导致这种行为?在像这样的大量进口之后,你会推荐什么样的东西?谢谢。
python - Cassandra 缓冲读取数百万列
我有一个带有少量行(< 100)的 cassandra 集群。每行大约有 200 万列。我需要得到一整行(所有 200 万列),但是在我完成阅读之前,事情开始到处都失败了。我想做某种缓冲读取。
理想情况下,我想使用 Pycassa 做这样的事情(不,这不是正确的调用方式get
,只是为了让你明白):
Pycassa(以及扩展的 Cassandra)不允许你这样做。相反,您需要为和指定列名。这是一个问题,因为我实际上不知道开始或结束列名是什么。特殊值可以指示行的开始或结束,但这不适用于中间的任何值。column_start
column_finish
""
那么我怎样才能完成对单行中所有列的缓冲读取呢?谢谢。