问题标签 [druid]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
druid - 由于输入结束,没有要映射的内容
似乎出乎意料的是,我收到了对以前工作的 Druid 查询的回复。我的猜测是这不是德鲁伊特有的,但我似乎无法弄清楚:
amazon-web-services - 德鲁伊不存储到 AWS S3
我正在尝试将数据推送到 AWS S3。我在( http://druid.io/docs/0.7.0/Tutorial:-The-Druid-Cluster.html )中有用户示例,但修改了 common.runtime.properties 如下
以下是实时节点的日志
2015-03-02T15:03:44,809 INFO [main] io.druid.guice.JsonConfigurator - 从 props[druid.query.] 加载类 [class io.druid.query.QueryConfig] 作为 [io.druid.query.QueryConfig @2edcd9d] 2015-03-02T15:03:44,843 INFO [main] io.druid.guice.JsonConfigurator - 从 props[druid.query.search.] 加载类 [class io.druid.query.search.search.SearchQueryConfig]作为 [io.druid.query.search.search.SearchQueryConfig@7939de8b] 2015-03-02T15:03:44,861 INFO [main] io.druid.guice.JsonConfigurator - 加载类 [class io.druid.query.groupby.GroupByQueryConfig ] from props[druid.query.groupBy.] as [io.druid.query.groupby.GroupByQueryConfig@bea8209] 2015-03-02T15:03:44,874 INFO [main] org.skife.config.ConfigurationObjectFactory - 赋值 [100000000 ] 用于 [io.druid.query 上的 [druid.processing.buffer.sizeBytes]。DruidProcessingConfig#intermediateComputeSizeBytes()] 2015-03-02T15:03:44,878 INFO [main] org.skife.config.ConfigurationObjectFactory - 在 [io.druid.query.DruidProcessingConfig# 上为 [druid.processing.numThreads] 分配值 [2] getNumThreads()] 2015-03-02T15:03:44,878 INFO [main] org.skife.config.ConfigurationObjectFactory - 在 [io.druid.query.DruidProcessingConfig#columnCacheSizeBytes] 上为 [${base_path}.columnCache.sizeBytes] 使用方法本身()] 2015-03-02T15:03:44,880 INFO [main] org.skife.config.ConfigurationObjectFactory - 为 [com.metamx.common 上的 [${base_path}.formatString] 分配默认值 [processing-%s]。 concurrent.ExecutorServiceConfig#getFormatString()] 2015-03-02T15:03:44,956 INFO [main] io.druid.guice.JsonConfigurator - 从 props[druid.query.topN.] 作为 [io.druid.query.topn.TopNQueryConfig@276503c4] 2015-03-02T15:03:44,960 INFO [main] io.druid.guice.JsonConfigurator - 从 props[druid.storage.] 加载类 [class io.druid.segment.loading.LocalDataSegmentPusherConfig] 作为 [io.druid.segment .loading.LocalDataSegmentPusherConfig@360548eb] 2015-03-02T15:03:44,967 INFO [main] io.druid.guice.JsonConfigurator - 从 props[druid.server.] 加载类 [class io.druid.client.DruidServerConfig] 作为 [io.druid.client.DruidServerConfig @ 75ba7964] 2015-03-02T15:03:44,971 INFO [main] io.druid.guice.JsonConfigurator - 从 props[druid.announcer.] 加载类 [class io.druid.server.initialization.BatchDataSegmentAnnouncerConfig] 作为 [io. druid.server.initialization.BatchDataSegmentAnnouncerConfig@1ff2a544] 2015-03-02T15:03:44,984 INFO [main] io.druid.guice.JsonConfigurator - 从 props[druid. zk.paths.] as [io.druid.server.initialization.ZkPathsConfig@58d3f4be] 2015-03-02T15:03:44,990 INFO [main] io.druid.guice.JsonConfigurator - 加载类 [class io.druid.curator. CuratorConfig] 来自 props[druid.zk.service.] 作为 [io.druid.curator.CuratorConfig@5fd11499]
apache-zookeeper - 配置 Druid 连接到 Zookeeper 的 5181 端口
我正在运行一个 MapR 集群,并想用Druid做一些时间序列分析。MapR 使用 Zookeeper 的非标准端口(端口 5181 而不是传统的端口 2181)。
当我启动 Druid 协调器服务时,它尝试连接常规 Zookeeper 端口并失败:
Druid 文档显示Zookeeper主机可以通过druid.zk.service.host
. config/_common/common.runtime.properties
它没有指定编辑 Zookeeper 端口的属性。
Druid 的 Zookeeper 端口是否可配置?或者如果将 Druid 与 MapR 一起使用,是否需要运行额外的 Zookeeper 服务?
scala - 如何配置宁静以显示调试日志
我想使用宁静及其风暴螺栓向德鲁伊发送数据。所以我编写了一个风暴拓扑(具有宁静的依赖性)并将其编译为一个 jar 文件,然后在本地模式下使用该 jar 文件运行风暴。然而我遇到了问题:风暴螺栓显示没有错,德鲁伊的霸王节点没有记录。感觉霸主没有收到风暴螺栓发送的数据。
我想找出问题所在。我确实启用了风暴配置的调试
但它只显示每个spout
and的详细信息bolt
,它不显示tranquility
调试日志信息。我尝试将风暴更改logback/cluster.xml
为
但它似乎不起作用。我尝试在项目的顶级目录中添加一个 log4j.xml:
它也不起作用。
我对宁静的源代码进行了一些挖掘,发现宁静依赖于依赖于 log4j 的ladylog 库,所以我认为在项目中添加一个 log4j.xml 将启用调试模式并可以看到这个 BeamBot的调试输出
我完全糊涂了,因为现在我写了一个使用 tranquiity 库的 jar,它使用 loglady 库,它使用 log4j,而我的 jar 由 Storm 运行,使用 logback。谁能给我一些建议?
java - 在 linux 中加载扩展时出现 NullPointerException
嗨,我是Druid和zookeeper的新手,在这里尝试他们的基本类型。
我所做的只是运行两个命令。第一个是运行zookeeper:
所以zookeeper似乎已经开始很好了。
第二个命令是运行 druid 的 tarball 内置的示例。这就是我遇到麻烦的地方。
它是否正在尝试在线下载某些内容,因为它Loading extension[io.druid.extensions:druid-examples] for class[io.druid.cli.CliCommandCreator]
在第 16 行显示。我在公司防火墙后面,因此如果完成任何下载尝试,某些内容可能会被阻止。它还NullPointerException
在第 18 行说。确切的问题是什么?
我真的无法干净地运行这个例子。我也在 Fedora 20 上,使用 zookeeper 3.4.6 和 druid 0.7.1.1。
java - 运行德鲁伊示例应用程序时出现 java.nio.channels.UnresolvedAddressException
我正在 Fedora 20 x64 上使用 zookeeper 34.6 试用 druid.io。你正在关注[这里]( http://druid.io/docs/latest/Tutorial:-A-First-Look-at-Druid.html)
经过巨大的努力,我能够运行动物园管理员。现在,当我运行示例 druid 应用程序的服务器时,它给了我以下错误。请注意,它说 Inventory initialized
那么它无法解决哪个地址?我对德鲁伊和动物园管理员都是新手,所以一定缺少一些架构理解。
druid - Druid如何实时输入数据?
我有分析服务器(例如点击计数器)。我想使用一些 api 向德鲁伊发送数据。我该怎么做?我可以用它代替谷歌分析吗?
druid - 从 druid.io 的 my_table 中选择前 N 个 - 一个最简单的请求 - 如何?
如何 使用尽可能简单的请求从Druid请求一些“记录”而不使用任何搜索/过滤条件?我是关系数据库,我会通过从 my_table 中选择前 10 个来做到这一点。
我想这样做的原因是确保数据存在并查看其结构。
java - 是在维度上聚合(计数),而不是在 Druid 支持的指标上
例如,有两个维度:[国家、网站]和一个指标:[PV]。
我想知道每个国家网站的平均 PV。
要做到这一点,很容易得到每个国家的总PV,但是很难得到每个国家的网站数量,而且预期的结果是总PV(在每个国家)除以网站数量(在每个国家)国家)。
我可以做的是按如下国家和网站应用“groupBy”查询,然后在我的应用程序中按国家以外的国家对结果进行分组。它非常非常非常慢,因为查询从 Druid 中提取了大量数据,其中大部分数据只是为了求和而毫无意义。
任何人都可以帮助解决这个问题?我想知道德鲁伊不可能不支持这样的常见查询。
提前致谢。
为了清楚起见,我用 SQL 描述了我的预期结果,如果你知道我想做什么或不熟悉 SQL,请忽略以下部分。