问题标签 [cassandra-2.0]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
272 浏览

hadoop - 运行 Cassandra + Pig 时出错

我正在使用 cassandra/example/pig/bin/pig_cassandra 脚本在 Cassandra 上运行 Pig 脚本。执行rows = LOAD 'cassandra://schema1/users' USING org.apache.cassandra.hadoop.pig.CassandraStorage();时出现错误

错误:错误 org.apache.pig.tools.grunt.Grunt - 错误 1069:解析类 org.apache.cassandra.hadoop.pig.CassandraStorage 的类版本号时出现问题

我在 mac os x 10.9 上使用 java 7 运行 cassandra 2.0.3、pig 0.12.0

请指导我解决此问题。在此先感谢您的帮助。

0 投票
1 回答
1780 浏览

cassandra - Cassandra ArrayIndexOutOfBoundsException

我创建了以下模式来表示用户和一组按他们的最后一条消息排序的线程之间的关联(用户已阅读哪些线程,他没有阅读哪些线程):

插入一些值后,我尝试运行此查询以获取用户的最新已读或未读线程:

如果通过 cqlsh 运行,则该查询有效。但是,当通过 datastax 客户端运行时,在客户端我们会遇到超时异常,而在服务器端,Cassandra 日志会显示此异常:

有谁知道问题是什么?谢谢!

0 投票
1 回答
764 浏览

cassandra - Token Aware Astyanax 连接池在节点上连接而不在节点上分配连接

我正在使用 astyanax 连接池,定义如下:

但是,我的集群有 4 个节点,并且有 8 台客户端机器连接在上面。LOAD_BALANCER_HOST将请求转发到我的四个节点之一。

在客户端节点上,我有:

因此,虽然 ConnectionPoolType 是TOKEN_AWARE,但我的客户端似乎主要连接到 node2,有时连接到 node1,但几乎从不连接到节点 3 和 4。
问题是:为什么会发生这种情况?令牌感知连接池不应该查询节点列表的环并使用循环算法连接到所有活动节点吗?

0 投票
16 回答
53795 浏览

cassandra-2.0 - Apache Cassandra:无法使用任何种子进行八卦

我已经构建了 Cassandra 服务器 2.0.3,然后运行它。它正在启动,然后通过消息停止:

我可以改变什么来运行它?

0 投票
2 回答
382 浏览

hadoop - 如何从 hive 0.9.0 访问 cassandra 2.0.3

我已经安装了 cassandra 2.0.3 和 hive 0.9.0。

我已经按照以下链接获取对 cassandra 的配置单元支持。 https://github.com/milliondreams/hive

但它说“Cassandra Hive 处理程序与 Cassandra 1.2.6 和 hive 0.9 一起工作”而我的 cassandra 版本是 2.0.3

任何人都可以详细指导我如何从 hive 0.9.0 访问 cassandra 2.0.3,因为我是 cassandra 和 hive 的新手。

——哈利

0 投票
1 回答
490 浏览

cassandra - Cassandra 多写分布

我安装了一个 3 节点 Cassandra (2.0.3) 集群,这是我的表:

我使用 datastax java 驱动程序

这是我的用户对象创建:

我创建了其中的 10k - i 是用户数组中用户的索引。我不想使用批量插入,而是模拟插入多条记录的压力。这是我的代码:

  1. 计算记录数时(使用 cqlsh)我永远不会超过 4k(10k 中)
  2. 只有一个服务器正在执行写入(使用 opscenter 写入请求/所有节点图) - 我看不出原因:据我所知,密钥足够随机......

有人可以指出我的任何地方吗?

0 投票
2 回答
636 浏览

cassandra - 主机 /127.0.0.1 上的身份验证错误:协议版本 1 不支持 SASL 身份验证

使用身份验证连接到 Cassandra 集群时出现以下异常:

线程“主”com.datastax.driver.core.exceptions.AuthenticationException 中的异常:主机 /127.0.0.1 上的身份验证错误:com.datastax.driver.core.Connection.waitForSaslCompletion 的协议版本 1 不支持 SASL 身份验证(Connection.java:203) 在 com.datastax.driver.core.Connection.initializeTransport(Connection.java:169)

  • 我在配置文件中使用 PasswordAuthenticator 和 CassandraAuth*。
  • 使用默认 Cassandra 帐户(cassandra/cassandra)
0 投票
1 回答
526 浏览

timeout - 在大量写入和删除期间发生 Cassandra rpc 超时

我正在使用 cassandra 2.0,并且我创建了一个如下所示的列族:

我已经向该表写入了超过 200 万行,没有任何问题,并且我还执行了许多删除操作。

在快速连续删除大约 10k 次左右后出现问题,并且我开始遇到大量 rpc_timeouts。在此期间,通过 cqlsh 进行的简单“从 user_id_timestamp_index 中删除 user_id = 5 AND timestamp = '12345'”失败。

我注意到并尝试过的事情:

  1. 在 rpc 超时期间,2 个节点(共 5 个)上的平均负载飙升至约 50。
  2. 在这些负载密集型写入和删除期间,几乎每 5 分钟进行一次压缩。
  3. 在 rpc_timeouts 期间,tpstats 显示待处理的突变阶段:MutationStage 64(活动)395(待处理)48182373(完成)0 0
  4. 当此 CF 的 memtable 数据大小超过 3 mb 时,往往会发生超时。
  5. 在我执行 nodetool 刷新后,待处理的突变变为零并且 rpc 时间消失,直到 memtable 大小再次爬升到超过 3 mb。

我的问题是,有我可以调整的配置吗?例如,是否可以简单地每 5 分钟在该列族上强制执行一次 memtable 刷新?减轻此表的写入负载?一种加快写入速度并减少待处理阶段的方法?还是有更好的解决方案?

0 投票
2 回答
2588 浏览

scala - 使用 Spark hadoop API 创建 RDD 以访问 Cassandra DB

我正在运行一个节点 cassandra 2.0.3 和 Apache Spark 2.0.3

我创建了一个 scala 程序来创建一个使用 Spark hadoop API 访问 Cassandra DB 的 RDD。

当我在 spark-env.sh 中使用以下配置时,还应该在 bashrc 中为 spaark 设置哪些环境变量

我的示例scala代码如下

但是,当我在 Spark Master 上运行此作业时,它不会完成作业并给出以下日志。

所以基本上我很困惑并努力克服这个问题,因为我不明白这是我的 scala 代码或火花主从通信或火花环境配置的问题。

请求在这方面指导我。

0 投票
2 回答
1436 浏览

php - Cassandra PDO 连接 PHP

我已经让 Cassandra 在 Debian 服务器上运行良好,但是我希望从 PHP 应用程序连接到它。

目前看来 PDO 是解决任何复杂问题的方法,因为我能够使用 CQL。我正在使用 Apache Cassandra-PDO 项目的最新分叉版本。

我正在使用最新的 Cassandra 2.03,我可以从终端中的 CQLSH 很好地连接到它。当我尝试使用以下代码在 PHP 中连接时

我收到以下错误

我在互联网上似乎有一些类似的问题,但目前还没有解决方案。希望有人可以在这里对这个问题提供一些见解。