问题标签 [druid]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1571 浏览

druid - 由于输入结束,没有要映射的内容

似乎出乎意料的是,我收到了对以前工作的 Druid 查询的回复。我的猜测是这不是德鲁伊特有的,但我似乎无法弄清楚:

0 投票
1 回答
1341 浏览

amazon-web-services - 德鲁伊不存储到 AWS S3

我正在尝试将数据推送到 AWS S3。我在( http://druid.io/docs/0.7.0/Tutorial:-The-Druid-Cluster.html )中有用户示例,但修改了 common.runtime.properties 如下

以下是实时节点的日志

2015-03-02T15:03:44,809 INFO [main] io.druid.guice.JsonConfigurator - 从 props[druid.query.] 加载类 [class io.druid.query.QueryConfig] 作为 [io.druid.query.QueryConfig @2edcd9d] 2015-03-02T15:03:44,843 INFO [main] io.druid.guice.JsonConfigurator - 从 props[druid.query.search.] 加载类 [class io.druid.query.search.search.SearchQueryConfig]作为 [io.druid.query.search.search.SearchQueryConfig@7939de8b] 2015-03-02T15:03:44,861 INFO [main] io.druid.guice.JsonConfigurator - 加载类 [class io.druid.query.groupby.GroupByQueryConfig ] from props[druid.query.groupBy.] as [io.druid.query.groupby.GroupByQueryConfig@bea8209] 2015-03-02T15:03:44,874 INFO [main] org.skife.config.ConfigurationObjectFactory - 赋值 [100000000 ] 用于 [io.druid.query 上的 [druid.processing.buffer.sizeBytes]。DruidProcessingConfig#intermediateComputeSizeBytes()] 2015-03-02T15:03:44,878 INFO [main] org.skife.config.ConfigurationObjectFactory - 在 [io.druid.query.DruidProcessingConfig# 上为 [druid.processing.numThreads] 分配值 [2] getNumThreads()] 2015-03-02T15:03:44,878 INFO [main] org.skife.config.ConfigurationObjectFactory - 在 [io.druid.query.DruidProcessingConfig#columnCacheSizeBytes] 上为 [${base_path}.columnCache.sizeBytes] 使用方法本身()] 2015-03-02T15:03:44,880 INFO [main] org.skife.config.ConfigurationObjectFactory - 为 [com.metamx.common 上的 [${base_path}.formatString] 分配默认值 [processing-%s]。 concurrent.ExecutorServiceConfig#getFormatString()] 2015-03-02T15:03:44,956 INFO [main] io.druid.guice.JsonConfigurator - 从 props[druid.query.topN.] 作为 [io.druid.query.topn.TopNQueryConfig@276503c4] 2015-03-02T15:03:44,960 INFO [main] io.druid.guice.JsonConfigurator - 从 props[druid.storage.] 加载类 [class io.druid.segment.loading.LocalDataSegmentPusherConfig] 作为 [io.druid.segment .loading.LocalDataSegmentPusherConfig@360548eb] 2015-03-02T15:03:44,967 INFO [main] io.druid.guice.JsonConfigurator - 从 props[druid.server.] 加载类 [class io.druid.client.DruidServerConfig] 作为 [io.druid.client.DruidServerConfig @ 75ba7964] 2015-03-02T15:03:44,971 INFO [main] io.druid.guice.JsonConfigurator - 从 props[druid.announcer.] 加载类 [class io.druid.server.initialization.BatchDataSegmentAnnouncerConfig] 作为 [io. druid.server.initialization.BatchDataSegmentAnnouncerConfig@1ff2a544] 2015-03-02T15:03:44,984 INFO [main] io.druid.guice.JsonConfigurator - 从 props[druid. zk.paths.] as [io.druid.server.initialization.ZkPathsConfig@58d3f4be] 2015-03-02T15:03:44,990 INFO [main] io.druid.guice.JsonConfigurator - 加载类 [class io.druid.curator. CuratorConfig] 来自 props[druid.zk.service.] 作为 [io.druid.curator.CuratorConfig@5fd11499]

0 投票
2 回答
3191 浏览

apache-zookeeper - 配置 Druid 连接到 Zookeeper 的 5181 端口

我正在运行一个 MapR 集群,并想用Druid做一些时间序列分析。MapR 使用 Zookeeper 的非标准端口(端口 5181 而不是传统的端口 2181)。

当我启动 Druid 协调器服务时,它尝试连接常规 Zookeeper 端口并失败:

Druid 文档显示Zookeeper主机可以通过druid.zk.service.host. config/_common/common.runtime.properties它没有指定编辑 Zookeeper 端口的属性。

Druid 的 Zookeeper 端口是否可配置?或者如果将 Druid 与 MapR 一起使用,是否需要运行额外的 Zookeeper 服务?

0 投票
1 回答
691 浏览

scala - 如何配置宁静以显示调试日志

我想使用宁静及其风暴螺栓向德鲁伊发送数据。所以我编写了一个风暴拓扑(具有宁静的依赖性)并将其编译为一个 jar 文件,然后在本地模式下使用该 jar 文件运行风暴。然而我遇到了问题:风暴螺栓显示没有错,德鲁伊的霸王节点没有记录。感觉霸主没有收到风暴螺栓发送的数据。

我想找出问题所在。我确实启用了风暴配置的调试

但它只显示每个spoutand的详细信息bolt,它不显示tranquility调试日志信息。我尝试将风暴更改logback/cluster.xml

但它似乎不起作用。我尝试在项目的顶级目录中添加一个 log4j.xml:

它也不起作用。

我对宁静的源代码进行了一些挖掘,发现宁静依赖于依赖于 log4j 的ladylog 库,所以我认为在项目中添加一个 log4j.xml 将启用调试模式并可以看到这个 BeamBot的调试输出

我完全糊涂了,因为现在我写了一个使用 tranquiity 库的 jar,它使用 loglady 库,它使用 log4j,而我的 jar 由 Storm 运行,使用 logback。谁能给我一些建议?

0 投票
1 回答
462 浏览

java - 在 linux 中加载扩展时出现 NullPointerException

嗨,我是Druidzookeeper的新手,在这里尝试他们的基本类型。

我所做的只是运行两个命令。第一个是运行zookeeper:

所以zookeeper似乎已经开始很好了。

第二个命令是运行 druid 的 tarball 内置的示例。这就是我遇到麻烦的地方。

它是否正在尝试在线下载某些内容,因为它Loading extension[io.druid.extensions:druid-examples] for class[io.druid.cli.CliCommandCreator]在第 16 行显示。我在公司防火墙后面,因此如果完成任何下载尝试,某些内容可能会被阻止。它还NullPointerException在第 18 行说。确切的问题是什么?

我真的无法干净地运行这个例子。我也在 Fedora 20 上,使用 zookeeper 3.4.6 和 druid 0.7.1.1。

0 投票
1 回答
2081 浏览

java - 运行德鲁伊示例应用程序时出现 java.nio.channels.UnresolvedAddressException

我正在 Fedora 20 x64 上使用 zookeeper 34.6 试用 druid.io。你正在关注[这里]( http://druid.io/docs/latest/Tutorial:-A-First-Look-at-Druid.html

经过巨大的努力,我能够运行动物园管理员。现在,当我运行示例 druid 应用程序的服务器时,它给了我以下错误。请注意,它说 Inventory initialized

那么它无法解决哪个地址?我对德鲁伊和动物园管理员都是新手,所以一定缺少一些架构理解。

0 投票
4 回答
2862 浏览

druid - Druid如何实时输入数据?

我有分析服务器(例如点击计数器)。我想使用一些 api 向德鲁伊发送数据。我该怎么做?我可以用它代替谷歌分析吗?

0 投票
1 回答
347 浏览

druid - 从 druid.io 的 my_table 中选择前 N 个 - 一个最简单的请求 - 如何?

如何 使用尽可能简单的请求从Druid请求一些“记录”而不使用任何搜索/过滤条件?我是关系数据库,我会通过从 my_table 中选择前 10 个来做到这一点。

我想这样做的原因是确保数据存在并查看其结构。

0 投票
1 回答
13250 浏览

java - Java - java.lang.NoClassDefFoundError: com/google/inject/internal/util/$Preconditions

我正在为druid开发一个扩展,该扩展将 jclouds 用于 Rackspace Cloud Files,我遇到了 Google guice 的问题,我对 Java 不是很有信心。

我已经看到了这个问题,但是 guice 版本似乎没有冲突。

这是正在执行的代码:

这是日志:

我也不明白为什么"Cloud Files Api built."没有打印字符串。

路径lib目录:

更新 1

也许与这个问题有关?我将尝试将 Google guice 降级到 3.0。

更新 2

我将 Google guice 降级到 3.0,现在我有:

现在错误改变了:

0 投票
1 回答
1542 浏览

java - 是在维度上聚合(计数),而不是在 Druid 支持的指标上

例如,有两个维度:[国家、网站]一个指标:[PV]。

我想知道每个国家网站的平均 PV。

要做到这一点,很容易得到每个国家的总PV,但是很难得到每个国家的网站数量,而且预期的结果是总PV(在每个国家)除以网站数量(在每个国家)国家)

我可以做的是按如下国家和网站应用“groupBy”查询,然后在我的应用程序中按国家以外的国家对结果进行分组。它非常非常非常慢,因为查询从 Druid 中提取了大量数据,其中大部分数据只是为了求和而毫无意义。

任何人都可以帮助解决这个问题?我想知道德鲁伊不可能不支持这样的常见查询。

提前致谢。



为了清楚起见,我用 SQL 描述了我的预期结果,如果你知道我想做什么或不熟悉 SQL,请忽略以下部分。