问题标签 [datastax]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1754 浏览

cassandra - Cassandra minimum heap size

What is the minimum recommended heap size for Cassandra? On the Cassandra wiki page we can read: "the more memory, the better, with 4GB being the minimum we typically recommended"

On the Datastax website:

"Java heap space should be set to a maximum of 8GB or half of your total RAM, whichever is lower."

But I cannot find anywhere more information on what should be the minimum recommended heap RAM. Assuming we run other services on the same server we do not want Cassandra to use half of a RAM hence we need to specify the maximum HEAP memory. Should we aim at 4GB heap as minimum or 8GB or perhaps 2GB is absolutely fine?

0 投票
1 回答
6334 浏览

cassandra - 如何使用datastax java驱动程序将timeuuid插入cassandra或TimeUUID的无效版本

我在 cassandra 键空间中有一个类型为 timeuuid 的列。当我尝试从 java 代码中插入记录时(使用 DataStax java driver1.0.3)。我得到以下异常

这是我的示例代码:

我也尝试过使用UUIDs.timeBased()而不是now(). 但我得到了同样的例外。

任何有关如何插入/读取timeuuid数据类型的帮助将不胜感激。

0 投票
1 回答
140 浏览

cassandra - Cassandra write 如何检查写入的内容

我有 Datastax cassandra 多节点集群。我只有 2 个在特定时间间隔发生的批量加载过程,但是我可以从 Opscenter URL 中看到所有节点每 5 分钟写入一次。我如何检查经常写入的内容是有办法的。我试图检查 CF 的写入,但这没有帮助。

请让我知道有没有办法找出用 cassandra 写的内容?

谢谢

0 投票
2 回答
1001 浏览

java - Datastax solr:Cassandra 现在将刷新到两个最大的内存表以释放内存

我正在使用 4Go RAM 的单个节点上使用 datastax 3.1。我没有更改 cassandra-en.sh 和 cassandra.yaml 中的任何内容,除了“--Xss”(因为我的 java 版本需要更多)所以默认情况下,Cassandra 设置为 1Go 我的 -Xms 和 -Xmx 参数:- Xms1024M -Xmx1024M

但是,在大约 200 000 行(在 3 个不同的 column_families 中)之后插入我的数据时,Solr 和 cassandra 日志不断重复这种警告:

WARN StorageService Flushing CFS(Keyspace='OpsCenter',​ColumnFamily='rollups60') 缓解内存压力 17:58:07

警告 GCInspector 堆已满 0.8825103486201678。您可能需要减少 memtable 和/或缓存大小。Cassandra 现在将刷新到两个最大的内存表以释放内存。如果您不希望 Cassandra 自动执行此操作,请调整 cassandra.yaml 中的 flush_largest_memtables_at 阈值

所以,好吧,我的堆是满的,但是为什么在刷新之后,我的堆还是满的?

如果我此时停止插入数据。警告不断重复。如果我停止并重新启动 cassandra。提升没问题

看起来像内存泄漏问题对吗?那么我应该看哪里呢?

感谢您的未来帮助。

0 投票
1 回答
254 浏览

hadoop - 在 DataStax Enterprise 中更改减速器/映射器的数量

如何更改 Hadoop 中映射器/缩减器的数量?由于某些奇怪的原因,mapred-site.xml 中不存在 mapred.tasttracker.map.tasks.maximum 和 mapred.tasttracker.reduce.tasks.maximum。我确实设法在 dse-mapred-default.xml 中找到了这些设置,但是一旦打开 xml,就会有一条注释指出不应在此文件中编辑设置,并且应在 mapred-site 中覆盖这些属性。 xml。

我尝试将这两个设置添加到 mapred-site.xml 并重新启动 Hadoop,我希望这些数字也会在 dse-mapred-default.xml 中更新,但没有运气。

有人可以对此有所了解吗?

谢谢马吉德

0 投票
2 回答
10523 浏览

java - 如何关闭数据库连接 Datastax Java 驱动程序

我正在使用 Datastax Java 驱动程序。有一个使用相同的教程。

我不明白的是如何关闭与 cassandra 的连接?没有可用的关闭方法,我假设我们不想关闭会话,因为它预计每个应用程序都有一个。

问候高拉夫

0 投票
1 回答
413 浏览

deployment - 使用 datastax 进行错误的 SOlr 索引。从 1 个节点扩展到 2 个 cassandra 节点和 1 个搜索节点

我正在使用 Datastax 3.1.4 我正在尝试从一个简单的环(一个启用 Solr 的节点)到一个带有 2 个 cassandra 节点(禁用 Solr)和一个搜索节点(启用 Solr)的小环。

根据 Opscenter,集群部署良好,但是当我使用 Solr HTTP API 插入数据时出现问题......我没有收到警告或错误,但是如果在所有节点(即使是启用 Solr 的节点)中插入值,因为我检查,Solr 索引是错误的:根据 solr,只有少数文档被插入 9(而 20 已被插入并且存在于我的 cassandra 表中)

我很确定这是一个简单的配置问题,但我无法弄清楚它是什么......

0 投票
1 回答
1019 浏览

cassandra - 使用带有指定 IP 地址和 OpsCenter 社区的 Cassandra CCM 的问题

我可以很好地使用标准的自动配置版本与环回

当我尝试使用真实 IP 地址以便可以连接到 VM 之外的集群时,事情变得很不稳定。这是我跑的:

问题 1) 我不能使用“ccm start”。它超时。如果我独立启动每个节点,它可以工作 问题 2)节点不平衡 .21 拥有 87.6%,而其他两个各拥有 6.2%。另外我认为种子不正确,但是如果我在添加时尝试查看每个节点,那么我无法启动集群,因为它抱怨找不到种子节点,所以我只能在第一个问题 3 中使用 -s)一段时间后 OpsCenter 显示第一个,然后三个节点中的两个不可用,尽管“ccm node1 status” node2、node3 都显示它们正常且向上 问题 4)我能够手动配置 OpsCenter 代理,但它们没有工作直到我输入“local_interface”,所以广播地址有问题。即使在看到所有代理之后,OpsCenter 仍然表现得很奇怪,抱怨节点关闭并且没有在所有图表中显示数据。使用 ccm 压力,我能够看到 i/o 和 cpu 负载,但看不到集群读取和写入,而不是延迟。这是我配置代理的方式:

0 投票
1 回答
886 浏览

cassandra - DataStax OpsCenter 未在 centos dse 集群上启动

我正在尝试设置具有 5 个节点的 cassandra 集群。我已经在所有节点上安装了 dse,并通过命令在所有节点上启动了 dse。

sudo 服务 dse 启动

dse 在所有节点上运行良好。

现在我正在尝试按照http://www.datastax.com/documentation/opscenter/3.2/webhelp/index.html#opsc/install/../../opsc/install/opscInstallRHEL_t.html配置 opscenter

当我执行“sudo service opscenterd start”时,它启动没有任何问题,甚至日志也没有显示任何问题。

但是当我尝试执行“netstat -a | grep 8888”时,它没有显示任何监听器。

有人可以帮我确定问题吗?

谢谢,杰尼什

0 投票
1 回答
3635 浏览

java - 如果结果集较大,则使用 Cassandra 和 DataStax Java 驱动程序时出现 NoHostAvailableException

设置:

  • 2 节点 Cassandra 1.2.6 集群
  • 副本=2
  • 没有二级索引的非常大的 CQL3 表
  • Rowkey 是一个 UUID.randomUUID().toString()
  • 读取一致性设置为 ONE
  • 使用 DataStax java 驱动程序 1.0

请求:

尝试通过“ SELECT some-col from schema.table LIMIT nnn; ”进行表扫描

失败:

一旦超过某个 nnn LIMIT,我就会开始从驱动程序中获取 NoHostAvailableExceptions。

它的内容如下:

鉴于:对于具有数百万行的大表,这可能不是最开明的事情,但这是我学习不该做什么的方式,所以我非常感谢能够自愿调试这种错误的人。

例如,当这种情况发生时,没有迹象表明集群中的节点曾经遇到过请求问题(任何一个节点上的日志中都没有任何内容表明任何超时或失败)。此外,我在驱动程序上启用了跟踪,只要查询成功,它就会为您提供一些很好的自动跟踪(ala Oracle)信息。但是在这种情况下,驱动程序会抛出 NoHostAvailableException 并且没有可用的 ExecutionInfo,因此在这种情况下跟踪没有提供任何好处。

我还发现有趣的是,这似乎没有被记录为超时(我的 JMX 控制台告诉我没有发生超时)。所以,我不明白故障实际发生在哪里。我的想法是驱动程序有问题,但我不知道如何调试它(我真的很想)。

我已经阅读了几篇来自人们的帖子,其中指出 query'g for resultSets > 10000 rows 可能不是一个好主意,我愿意接受这一点,但我想了解导致异常的原因以及异常发生的位置.

FWIW,我还尝试在 cassandra.yaml 中调整超时属性,但这没有任何区别。

我欢迎任何建议、轶事、侮辱或对我在白痴开发商之家注册的金钱捐助。

问候!!