问题标签 [cassandra-2.0]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
7434 浏览

cassandra - 如何在 cassandra 2.0.5 中删除表或列族?

我正在尝试从我的数据库中删除一个表/列族,但我无法做到。

我尝试了以下命令,它们的响应是:

并且:

有人知道如何在 Cassandra 2.0.5 中删除表/列族吗?

我在用:

0 投票
2 回答
475 浏览

amazon-ec2 - cassandra:单一数据中心部署策略

我们计划使用 apache shiro 和 cassandra 进行分布式会话管理,非常类似于提到的 @ https://github.com/lhazlewood/shiro-cassandra-sample

需要有关在 Amazon EC2 中部署 cassandra 的建议:

在 EC2 中,我们有以下设置:单个区域、2 个可用区(AZ)、4 个节点

因此,cassandra 配置为:
单个 DataCenter:DC1 两个机架:Rack1、Rack2 4 个节点:Rack1_Node1、Rack1_Node2、Rack2_Node1、Rack2_Node2

使用的数据复制策略是NetworkTopologyStrategy

由于 Cassandra 用作会话数据存储,因此我们需要高一致性和可用性

我的问题:

  1. 我应该在一个集群中保留多少个副本?考虑 2 个副本,每个机架 1 个。
  2. 读写操作的一致性级别(CL)应该是多少?考虑到集群中的 2 个副本,考虑读取和写入的 QUORUM。
  3. 如果 1 个机架出现故障,Cassandra 是否会通过上述配置成功读写?我知道它可以对临时关闭节点使用hinted-hands-off,但它对读/写操作都有效吗?
  4. 对我的要求还有其他建议吗?
0 投票
2 回答
191 浏览

cassandra - Cassandra 2.0.X 中数据的 Cassandra 存储引擎表示

Cassandra CLI 在 Cassandra 3.0 中被弃用。想知道是否有可能获得宽行(动态列)的存储引擎表示,而不是关系视图。

例如,在 cassandra-cli 中执行以下命令将为键 'COEXEIGLE' 产生,具有动态列和计数器值:

虽然,使用 cqlsh,以下 sql 语句,我们将获得数据的传统关系视图:

同样,好奇我们是否仍然可以看到存储引擎表示而不是关系视图。

卡桑德拉版本:

0 投票
1 回答
1297 浏览

cassandra-2.0 - 单 Windows 机器上的多节点 cassandra 设置

我正在尝试在单个 Windows 机器上设置一个 3 节点 Cassandra 集群。这仅用于测试目的。

步骤 1 我通过 hosts 文件修改如下 127.0.0.1 node1 127.0.0.1 node2 127.0.0.1 node3

第 2 步在 C:\Cassandra(这是节点 1)C:\Cassandra\node2(节点 2)C:\Cassandra\node3(节点 3)上安装 Datastax Cassandra

步骤 3 更改所有 3 个节点 cluster_name:DevCluster 的 Cassandra.yaml 文件

节点 1:-seed:节点 1 初始令牌:0 监听地址:节点 1 rpc_地址:节点 1

node2:-seed:node1初始token:手动生成号listen_address:node2 rpc_address:node2

node3:-seed:node1初始token:手动生成号listen_address:node3 rpc_address:node3

我能够启动 Cassandra.bat 文件来运行该服务,但问题是在任何时候我都只能启动一个服务(任何节点),另一个服务关闭并显示错误消息

此外,根据日志消息,我将 storage_port、tcp_port 和 JMX_port 更改为不同的数字以避免端口冲突。我正在尝试形成一个集群......但遇到了这个错误。

如果有人可以指导我在搞砸什么,我将不胜感激。感谢您的答复。

0 投票
1 回答
116 浏览

cassandra-2.0 - Cassandra 数据模型

我是一个 cassandra 新手,试图了解如何在 cassandra 中对我们当前的 sql 数据进行建模。数据库存储文档元数据,其中包括 document_id、last_modified_time、size_in_bytes 以及许多其他数据,并且文档的数量可以任意大,因此我们正在寻找一种可扩展的存储和查询解决方案。

需要 2 个范围查询

  1. 选择 last_modified_time >=x 和 last_modified_time 的所有文档
  2. 选择 size >= x 和 size <= y 的所有文档

还有一组查询,其中文档需要按特定元数据分组,例如

  1. 选择用户在 (x,y,z) 中的所有文档

基于这些查询设计数据模型的最佳实践是什么?

我最初的想法是有一个表(在 Cassandra 2.0,CQL 3.0 中),其中 last_mod_time 作为二级索引,如下所示

创建表 t_document (document_id bigint,
last_mod_time bigint, size bigint, 用户文本, .... 主键 (document_id, last_mod_time) }

这应该处理查询 1。

我是否需要为查询 2 创建另一个主键为 (document_id, size) 的表?或者我可以将大小添加为同一个表的主键中的第三项,例如(document_id、last_mod_time、size)。但是在这种情况下,第二个查询是否会在 where 子句中不使用 last_mod_time 的情况下工作?

对于一个或多个用户的所有文档的查询 3,创建一个主键为 (user, doc_id) 的 t_user_doc 表是最佳实践吗?或者更好的方法是在同一个 t_document 表上为用户创建二级索引?

谢谢你的帮助。

0 投票
3 回答
7771 浏览

cassandra - cassandra 中的正则表达式搜索或 LIKE 类型功能

我正在使用 datastax cassandra 2.0 版。我们如何使用正则表达式在 cassandra 列中搜索值。有没有办法实现“LIKE”(如在 SQL 中)功能?

我创建了具有以下架构的表。

我插入了一些测试记录,如下所示。

我需要搜索记录,其中用户 ID 包含单词“jon”。所以在结果中,我得到所有记录,包含 jon、jony、jonathan。

我知道,cassandra 中没有 sql LIKE 功能。但是有没有办法在 cassandra 中实现它?(注意:我使用 datastax-java 驱动程序作为客户端 api)。

0 投票
3 回答
25858 浏览

hive - Hive 查询执行错误,从 MapredLocalTask​​ 返回代码 3

在两个表之间执行简单连接时出现此错误。我在 Hive 命令行中运行此查询。我将表命名为 a & b。表 a 是 Hive 内部表,b 是外部表(在 Cassandra 中)。表 a 只有 1610 行,表 b 有大约 800 万行。在实际生产场景中,表 a 可以达到 100K 行。下面显示的是我与表 b 作为连接中的最后一个表的连接

从 a JOIN b ON (a.col1=b.col1 AND a.col2=b.col2) 中选择 a.col1、a.col2、b.col3、b.col4;

下图是错误

MapReduce 作业总数 = 1
执行日志位于:/tmp/pricadmn/.log
2014-04-09 07:15:36 开始启动本地任务以处理 map join;最大内存 = 932184064
2014-04-09 07:16:41 处理行数:200000 哈希表大小:199999 内存使用率:197529208 百分比:0.212
2014-04-09 07:17:12 处理行数:300000 哈希表大小:299999 内存使用率: 163894528 百分比:0.176
2014-04-09 07:17:43 处理行数:400000 哈希表大小:399999 内存使用率:347109936 百分比:0.372
...
...
...

2014-04-09 07:24:29 处理行数:1600000 哈希表大小:1599999 内存使用率:714454400 百分比:0.766
2014-04-09 07:25:03 处理行数:1700000 哈希表大小:1699999 内存使用率:901427928 百分比:0。
执行失败,退出状态:3
获取错误信息


任务失败!
任务 ID:
Stage-5

日志:

/u/applic/pricadmn/dse-4.0.1/logs/hive/hive.log
失败:执行错误,从 org.apache.hadoop.hive.ql.exec.mr 返回代码 3 .MapredLocalTask

我正在使用 DSE 4.0.1。以下是我的一些设置,您可能对
mapred.map.child.java.opts=-Xmx512M
mapred.reduce.child.java.opts=-Xmx512M
mapred.reduce.parallel.copies=20
hive.auto.convert 感兴趣.join=true

我将 mapred.map.child.java.opts 增加到 1G,我又得到了几条记录,然后出错了。这看起来不是一个好的解决方案。我也改变了加入的顺序,但没有帮助。我看到了这个链接Hive Map join : out of memory Exception但没有解决我的问题。

对我来说,看起来 Hive 正试图在本地任务阶段将更大的表放入内存中,这让我感到困惑。根据我的理解,第二个表(在我的情况下是表 b)应该被流入。如果我错了,请纠正我。非常感谢解决此问题的任何帮助。

0 投票
1 回答
1160 浏览

macos - 如何在 mac os x 中安装/下载特定版本的 cassandra 分布式数据库?

我试图为我的 Mac OS X(小牛)安装 Cassandra 2.0.5,但每当我用谷歌搜索安装 Cassandra 2.0.5 时,我似乎都找不到如何安装我想要安装的特定版本的 Cassandra。

一般来说,有没有办法安装特定版本的 cassandra?也许通过 brew 或类似的东西?或者无论如何,我只想安装 Cassandra 2.0.5(但从长远来看,更通用的过程可能更有用)。

0 投票
1 回答
347 浏览

cassandra - 复合键上的 Cassandra 范围切片

我有这样的复合键列族

我需要做的是

这给了我这个错误

解决这个问题的最佳方法是什么?我需要更改我的列族吗?我还需要使用所有 keya、keyb、keyc和 date 查询这些表。

0 投票
1 回答
84 浏览

datastax-enterprise - 单节点上的 Cassandra 和 Analytics

使用 DataStax Enterprise,是否可以设置一个 cassandra 集群,可以在单台机器上进行 cassandra“实时”和分析?显然,这不是用于生产,而是用于概念验证/逻辑实验的微小证明,我宁愿启动一个 linux vm,而不是 2 或 3 个。如果不是通过 apt- 安装 tarball,这是否可行得到?