“cassandra-2.0”的相关标签问题

0 投票

1 回答

7434 浏览

cassandra - 如何在 cassandra 2.0.5 中删除表或列族？

我正在尝试从我的数据库中删除一个表/列族，但我无法做到。

我尝试了以下命令，它们的响应是：

并且：

有人知道如何在 Cassandra 2.0.5 中删除表/列族吗？

我在用：

2014-04-05T20:17:32.327

0 投票

2 回答

475 浏览

amazon-ec2 - cassandra：单一数据中心部署策略

我们计划使用 apache shiro 和 cassandra 进行分布式会话管理，非常类似于提到的 @ https://github.com/lhazlewood/shiro-cassandra-sample

需要有关在 Amazon EC2 中部署 cassandra 的建议：

在 EC2 中，我们有以下设置：单个区域、2 个可用区（AZ）、4 个节点

因此，cassandra 配置为：
单个 DataCenter：DC1 两个机架：Rack1、Rack2 4 个节点：Rack1_Node1、Rack1_Node2、Rack2_Node1、Rack2_Node2

使用的数据复制策略是NetworkTopologyStrategy

由于 Cassandra 用作会话数据存储，因此我们需要高一致性和可用性。

我的问题：

我应该在一个集群中保留多少个副本？考虑 2 个副本，每个机架 1 个。
读写操作的一致性级别（CL）应该是多少？考虑到集群中的 2 个副本，考虑读取和写入的 QUORUM。
如果 1 个机架出现故障，Cassandra 是否会通过上述配置成功读写？我知道它可以对临时关闭节点使用hinted-hands-off，但它对读/写操作都有效吗？
对我的要求还有其他建议吗？

amazon-ec2 cassandra cassandra-2.0

2014-04-07T18:07:49.113

0 投票

2 回答

191 浏览

cassandra - Cassandra 2.0.X 中数据的 Cassandra 存储引擎表示

Cassandra CLI 在 Cassandra 3.0 中被弃用。想知道是否有可能获得宽行（动态列）的存储引擎表示，而不是关系视图。

例如，在 cassandra-cli 中执行以下命令将为键 'COEXEIGLE' 产生，具有动态列和计数器值：

虽然，使用 cqlsh，以下 sql 语句，我们将获得数据的传统关系视图：

同样，好奇我们是否仍然可以看到存储引擎表示而不是关系视图。

卡桑德拉版本：

cassandra cassandra-2.0 cqlsh cassandra-cli cassandra-3.0

2014-04-08T04:17:27.720

0 投票

1 回答

1297 浏览

cassandra-2.0 - 单 Windows 机器上的多节点 cassandra 设置

我正在尝试在单个 Windows 机器上设置一个 3 节点 Cassandra 集群。这仅用于测试目的。

步骤 1 我通过 hosts 文件修改如下 127.0.0.1 node1 127.0.0.1 node2 127.0.0.1 node3

第 2 步在 C:\Cassandra（这是节点 1）C:\Cassandra\node2（节点 2）C:\Cassandra\node3（节点 3）上安装 Datastax Cassandra

步骤 3 更改所有 3 个节点 cluster_name:DevCluster 的 Cassandra.yaml 文件

节点 1：-seed：节点 1 初始令牌：0 监听地址：节点 1 rpc_地址：节点 1

node2：-seed：node1初始token：手动生成号listen_address：node2 rpc_address：node2

node3：-seed：node1初始token：手动生成号listen_address：node3 rpc_address：node3

我能够启动 Cassandra.bat 文件来运行该服务，但问题是在任何时候我都只能启动一个服务（任何节点），另一个服务关闭并显示错误消息

此外，根据日志消息，我将 storage_port、tcp_port 和 JMX_port 更改为不同的数字以避免端口冲突。我正在尝试形成一个集群......但遇到了这个错误。

如果有人可以指导我在搞砸什么，我将不胜感激。感谢您的答复。

cassandra-2.0

2014-04-08T13:30:44.473

0 投票

1 回答

116 浏览

cassandra-2.0 - Cassandra 数据模型

我是一个 cassandra 新手，试图了解如何在 cassandra 中对我们当前的 sql 数据进行建模。数据库存储文档元数据，其中包括 document_id、last_modified_time、size_in_bytes 以及许多其他数据，并且文档的数量可以任意大，因此我们正在寻找一种可扩展的存储和查询解决方案。

需要 2 个范围查询

选择 last_modified_time >=x 和 last_modified_time 的所有文档
选择 size >= x 和 size <= y 的所有文档

还有一组查询，其中文档需要按特定元数据分组，例如

选择用户在 (x,y,z) 中的所有文档

基于这些查询设计数据模型的最佳实践是什么？

我最初的想法是有一个表（在 Cassandra 2.0，CQL 3.0 中），其中 last_mod_time 作为二级索引，如下所示

创建表 t_document (document_id bigint,
last_mod_time bigint, size bigint, 用户文本, .... 主键 (document_id, last_mod_time) }

这应该处理查询 1。

我是否需要为查询 2 创建另一个主键为 (document_id, size) 的表？或者我可以将大小添加为同一个表的主键中的第三项，例如（document_id、last_mod_time、size）。但是在这种情况下，第二个查询是否会在 where 子句中不使用 last_mod_time 的情况下工作？

对于一个或多个用户的所有文档的查询 3，创建一个主键为 (user, doc_id) 的 t_user_doc 表是最佳实践吗？或者更好的方法是在同一个 t_document 表上为用户创建二级索引？

谢谢你的帮助。

cassandra-2.0

2014-04-08T20:28:53.057

0 投票

3 回答

7771 浏览

cassandra - cassandra 中的正则表达式搜索或 LIKE 类型功能

我正在使用 datastax cassandra 2.0 版。我们如何使用正则表达式在 cassandra 列中搜索值。有没有办法实现“LIKE”（如在 SQL 中）功能？

我创建了具有以下架构的表。

我插入了一些测试记录，如下所示。

我需要搜索记录，其中用户 ID 包含单词“jon”。所以在结果中，我得到所有记录，包含 jon、jony、jonathan。

我知道，cassandra 中没有 sql LIKE 功能。但是有没有办法在 cassandra 中实现它？（注意：我使用 datastax-java 驱动程序作为客户端 api）。

cassandra cql3 datastax cassandra-2.0

2014-04-09T17:58:30.077

0 投票

3 回答

25858 浏览

hive - Hive 查询执行错误，从 MapredLocalTask 返回代码 3

在两个表之间执行简单连接时出现此错误。我在 Hive 命令行中运行此查询。我将表命名为 a & b。表 a 是 Hive 内部表，b 是外部表（在 Cassandra 中）。表 a 只有 1610 行，表 b 有大约 800 万行。在实际生产场景中，表 a 可以达到 100K 行。下面显示的是我与表 b 作为连接中的最后一个表的连接

从 a JOIN b ON (a.col1=b.col1 AND a.col2=b.col2) 中选择 a.col1、a.col2、b.col3、b.col4；

下图是错误

MapReduce 作业总数 = 1
执行日志位于：/tmp/pricadmn/.log
2014-04-09 07:15:36 开始启动本地任务以处理 map join；最大内存 = 932184064
2014-04-09 07:16:41 处理行数：200000 哈希表大小：199999 内存使用率：197529208 百分比：0.212
2014-04-09 07:17:12 处理行数：300000 哈希表大小：299999 内存使用率： 163894528 百分比：0.176
2014-04-09 07:17:43 处理行数：400000 哈希表大小：399999 内存使用率：347109936 百分比：0.372
...
...
...

2014-04-09 07:24:29 处理行数：1600000 哈希表大小：1599999 内存使用率：714454400 百分比：0.766
2014-04-09 07:25:03 处理行数：1700000 哈希表大小：1699999 内存使用率：901427928 百分比：0。
执行失败，退出状态：3
获取错误信息

任务失败！
任务 ID：
Stage-5

日志：

/u/applic/pricadmn/dse-4.0.1/logs/hive/hive.log
失败：执行错误，从 org.apache.hadoop.hive.ql.exec.mr 返回代码 3 .MapredLocalTask

我正在使用 DSE 4.0.1。以下是我的一些设置，您可能对
mapred.map.child.java.opts=-Xmx512M
mapred.reduce.child.java.opts=-Xmx512M
mapred.reduce.parallel.copies=20
hive.auto.convert 感兴趣.join=true

我将 mapred.map.child.java.opts 增加到 1G，我又得到了几条记录，然后出错了。这看起来不是一个好的解决方案。我也改变了加入的顺序，但没有帮助。我看到了这个链接Hive Map join : out of memory Exception但没有解决我的问题。

对我来说，看起来 Hive 正试图在本地任务阶段将更大的表放入内存中，这让我感到困惑。根据我的理解，第二个表（在我的情况下是表 b）应该被流入。如果我错了，请纠正我。非常感谢解决此问题的任何帮助。

hive hiveql datastax-enterprise cassandra-2.0

2014-04-10T02:52:06.103

0 投票

1 回答

1160 浏览

macos - 如何在 mac os x 中安装/下载特定版本的 cassandra 分布式数据库？

我试图为我的 Mac OS X（小牛）安装 Cassandra 2.0.5，但每当我用谷歌搜索安装 Cassandra 2.0.5 时，我似乎都找不到如何安装我想要安装的特定版本的 Cassandra。

一般来说，有没有办法安装特定版本的 cassandra？也许通过 brew 或类似的东西？或者无论如何，我只想安装 Cassandra 2.0.5（但从长远来看，更通用的过程可能更有用）。

macos cassandra cassandra-2.0

2014-04-10T19:01:35.497

0 投票

1 回答

347 浏览

cassandra - 复合键上的 Cassandra 范围切片

我有这样的复合键列族

我需要做的是

这给了我这个错误

解决这个问题的最佳方法是什么？我需要更改我的列族吗？我还需要使用所有 keya、keyb、keyc和 date 查询这些表。

cassandra cql cassandra-2.0

2014-04-15T07:00:12.390

0 投票

1 回答

84 浏览

datastax-enterprise - 单节点上的 Cassandra 和 Analytics

使用 DataStax Enterprise，是否可以设置一个 cassandra 集群，可以在单台机器上进行 cassandra“实时”和分析？显然，这不是用于生产，而是用于概念验证/逻辑实验的微小证明，我宁愿启动一个 linux vm，而不是 2 或 3 个。如果不是通过 apt- 安装 tarball，这是否可行得到？

datastax-enterprise cassandra-2.0

2014-04-15T18:33:38.870

问题标签 [cassandra-2.0]

Reference