问题标签 [pycassa]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
5 回答
7736 浏览

python - 如何使用 pycassa 获取存储在 Cassandra 列族中的所有键?

有没有人有使用pycassa的经验,我对此表示怀疑。如何获取存储在数据库中的所有密钥?

好吧,在这个小片段中,我们需要提供键以获取关联的列(这里的键是“foo”和“bar”),这很好,但我的要求是一次获取所有键(只有键)作为 Python 列表或类似的数据结构。

谢谢。

0 投票
2 回答
4308 浏览

python - 在 Python 中为 Cassandra 生成 UUID

呵呵,我用

cf.insert(uuid.uuid1().bytes_le, {'column1': 'val1'}) (皮卡萨)

为 Cassandra 创建 TimeUUID,但出现错误

它不适用于

任何一个。

创建与 CompareWith="TimeUUIDType" 标志一起使用的有效 TimeUUID 的最佳方法是什么?

谢谢,
亨里克

0 投票
2 回答
1409 浏览

java - 为 Django 设置 Cassandra -“ImportError:没有名为 pycassa 的模块”

我遵循了本指南:https ://github.com/ericflo/twissandra

Pycassa 已安装,包括所有依赖项。一切运行顺利,但运行python manage.py sync_cassandra给出消息:

所以我运行 Python 交互式解释器并输入import pycassa,该命令运行成功,没有错误。

跑步

将给出消息:

site-packages在列表中。但我有点困惑,因为这是在虚拟环境中

我不知道发生了什么以及该怎么办

0 投票
1 回答
898 浏览

django - Setup Cassandra for Django - "python manage.py sync_cassandra" or "sudo python manage.py sync_cassandra"

I'm following guide in https://github.com/thobbs/twissandra

I'm still stuck at:


python manage.py sync_cassandra will generate


sudo python manage.py sync_cassandra will generate

yes, that was errors.. But I'm a bit confuse, sudo or not sudo...
python manage.py sync_cassandra or sudo python manage.py sync_cassandra

0 投票
2 回答
283 浏览

django - 为 Django 设置 Cassandra -“AttributeError:'SystemManager' 对象没有属性 'describe_keyspace'”

我已按照https://github.com/thobbs/twissandra中的分步指南进行操作

我被困在python manage.py sync_cassandra收到消息的地方:

我对此一无所知。该怎么办?

0 投票
1 回答
1022 浏览

cassandra - 要知道在 Cassandra 中找不到哪个键?

我正在使用 pycassa。我正在请求一行中的一些列:

如果指定的行键或任何开始和结束列键不存在,则会引发 NotFoundException。有没有办法确定未找到哪个键 - 行键或列键(名称)?

0 投票
1 回答
670 浏览

python - 将 pycassa 与 uwsgi 一起使用时的问题

我们将 pycassa 与 uwsgi 一起使用。大约有 16 个 uwsgi 进程。

奇怪的是,一个进程可以得到另一个进程查询的数据。例如,列族 A 中有一行,如下所示:

{row_key, {'column_a': 1, 'column_b': 2}}

进程 1 运行:get(row_key, columns=['column_a', ])

进程 2 运行:get(row_key, columns=['column_b', ])

但是,有时,进程 1 得到 column_b 的值,进程 2 得到 column_a 的值。

这是连接池的已知问题吗?

任何回应表示赞赏。

0 投票
1 回答
596 浏览

benchmarking - 使用 pycassa 进行压力测试

我一直在尝试为相当大的 cassandra 数据库编写压力测试器。起初我是从头开始做的,然后我发现了stress.py,它可以让你对你的集群进行压力测试。但是,与所有基准测试一样,测试数据不代表该数据库将看到的负载。因此,我决定对其进行修改,使其更符合我的使用模式。

我在这个项目的大部分时间都使用 pycassa。但是stress.py 直接使用了底层的thrift 接口,我觉得这很麻烦。有没有使用 pycassa 对 cassandra 进行压力测试的项目?谢谢!

0 投票
2 回答
2732 浏览

cassandra - Cassandra 多获取性能

我有一个 cassandra 集群,其行数相当少(200 万左右,我希望这对于 cassandra 来说是“小”)。每行都以唯一的 UUID 为键,每行大约有 200 列(给或取几列)。总而言之,这些都是非常小的行,没有二进制数据或大量文本。只是短字符串。

我刚刚完成了从旧数据库到 cassandra 集群的初始导入。我已经在每台机器上调整了 cassandra。有数亿次写入,但没有读取。现在是时候使用这个东西了,我发现读取速度绝对令人沮丧。我正在一次使用 pycassa 在 500 到 10000 行的任何地方进行 multiget。即使在 500 行时,性能也很糟糕,有时需要 30 多秒。

什么会导致这种行为?在像这样的大量进口之后,你会推荐什么样的东西?谢谢。

0 投票
2 回答
1373 浏览

python - Cassandra 缓冲读取数百万列

我有一个带有少量行(< 100)的 cassandra 集群。每行大约有 200 万列。我需要得到一整行(所有 200 万列),但是在我完成阅读之前,事情开始到处都失败了。我想做某种缓冲读取。

理想情况下,我想使用 Pycassa 做这样的事情(不,这不是正确的调用方式get,只是为了让你明白):

Pycassa(以及扩展的 Cassandra)不允许你这样做。相反,您需要为和指定列。这是一个问题,因为我实际上不知道开始或结束列名是什么。特殊值可以指示行的开始或结束,但这不适用于中间的任何值。column_startcolumn_finish""

那么我怎样才能完成对单行中所有列的缓冲读取呢?谢谢。