问题标签 [druid]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
247 浏览

java - Druid中存储HashMap的数据结构

我是德鲁伊的新手。我的问题是如何在 Druid 中使用 java 来存储和查询 HashMap 进行交互。我有network table如下:

另外,我有range-time table

在 Druid 中,我可以将range-time表存储为 aHashMap并使用以下语句查询上面的两个表:

谁能帮我 ?非常感谢。

0 投票
3 回答
1191 浏览

druid - 宁静不向德鲁伊发送数据

我正在为我的用例评估 Druid,该用例通过宁静实时摄取 csv 数据。以下是服务器配置:-

数据由 python 脚本随机生成:-

以下命令提交数据并返回{"result":{"received":1000,"sent":0}}

0 投票
3 回答
7489 浏览

elasticsearch - 德鲁伊与 Elasticsearch

我是德鲁伊的新手。已经看过《druid VS Elasticsearch》了,但是还是不知道druid擅长什么。

以下是我的问题:

  1. 我有一个 70 个节点的 solr 集群。

  2. 我在 solr 中有一个非常大的表,它有 10 亿行,每行有 100 个字段。

  3. 用户会使用字段的不同组合范围查询(一次查询至少20种组合)来统计customer id的distinct个数,但是solr的distinct count算法很慢而且占用内存很大,所以如果查询结果是超过20万,solr的查询节点就会崩溃。

druid 在不同的计数上是否比 solr 具有更好的性能?

0 投票
1 回答
236 浏览

java - SegmentGranularity按天和按小时比较有效性能查询topN

我在https://groups.google.com/forum/#!topic/druid-user/SY​​Wcqcr504k上问了我的问题, 但没有人帮我解决这个问题。

我正在处理大型数据集。在 2 种情况下的 topN 查询(​​按天计算的段粒度与按小时计算的段粒度)在 sam 上的“queryGranularity”按“小时”计算。

案例01:白天

案例02:按小时

但是对 "segmentGranularity" : "day" 的查询时间比 "segmentGranularity" : "hour" 慢。谁能解释一下这个案子?为什么按天分段比按小时慢?在按天和按小时存储数据段之间,如何选择段类型?它如何影响我的查询?非常感谢 !

0 投票
1 回答
66 浏览

java - “错误”:德鲁伊时间序列查询中的“空异常”

我正在对我的索引数据使用时间序列查询,以下代码片段:

我确保它完全在间隔和聚合参数中。但是当我使用命令行查询它时:

结果是这样的:

谁能解释为什么会出错并帮助我修复它?谢谢十亿。

0 投票
1 回答
1624 浏览

java - 使用 Apache HttpClient 连接 Druid 的 Java 客户端

我正致力于在 Druid Server 上摄取和查询数据。但是,当我查询时,我只是使用如下命令行:

谁能告诉我如何使用带有 Apache HttpClient 的 Java 客户端将该查询发送到 Druid 服务器以获得响应。非常感谢。

0 投票
1 回答
168 浏览

java - 将数据流式传输到 Druid 服务器

我有广告日志数据,我想将其实时发送到 Druid 服务器。但是,问题在于 Tranquility 和 Kafka 之间。这是实时摄取数据的最佳方法。因为,当使用 kafka 时,它会产生一堆错误。我尝试使用宁静。在这个问题上有经验的人可以帮助我吗?非常感谢。

0 投票
1 回答
717 浏览

mesos - 在 DC/OS 上运行 Druid 的最佳方式是什么?

在 DC/OS 上运行 Druid 的最佳方式是什么?我看到有两种可能的选择;马拉松和码头工人。你会推荐哪一个?有没有更好的办法?

0 投票
1 回答
941 浏览

java - 为什么获取已经关闭的连接,导致“holder is null”错误

这是嵌套问题,请帮忙分析原因

整体代码结构说明:</p>

TransactionA 在一些DB 操作中,然后打开transactionB。TransactionA 提交时间触发自定义触发器,该触发器在开启事务C(PROPAGATION_REQUIRES_NEW)

在此处输入图像描述

报错过程是这样的:第一次运行是正确的没有错误,第二次运行时得到一个关闭的连接,测试代码是这样的:</p>

错误堆栈:</p>

主要代码:</p>

1 详细代码:</p>

2、3 详细代码:</p>

3 同步码(问题码):</p>

3 同步码(正确码):</p>

0 投票
0 回答
737 浏览

java - Storm 与 druid 类 com.fasterxml.jackson.module.scala.ser.ScalaIteratorSerializer 的集成覆盖了 final 方法 withResolved 错误

我对风暴和德鲁伊都是新手。从最近几天开始,我一直在这个问题上。我正在将数据从 Kafka 发送到storm,然后再发送到druid。* 我认为 druidbeambolt 正在接收数据,但在传输到 druid 之前无法将其转换为 JSON。查看我的 druidboltfactory 代码以获取更多详细信息*。如果每个人都需要有关代码的更多信息,请告诉我,提前谢谢

这是错误

*这是我的风暴拓扑课程 *

这是我的德鲁伊光束螺栓

这是我的德鲁伊螺栓工厂 ,我认为问题出在这个螺栓上。特别是在创建对象构建器时。Builder 在内部通过 Jackson 将事件类型序列化为 Druid 可以理解的 JSON。

这是我的 pom.xml