问题标签 [druid]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
520 浏览

r - 从 Druid 数据库中随机抽样

我刚刚开始使用 Druid,特别是 RDruid,由于我们的数据集非常大,我想从数据库中提取一个更小的随机样本。

使用 RDruid 我有一个查询,如下所示:

我想让它在基础数据的随机部分上构建每小时/每分钟的汇总。

这甚至可能吗?也许我可以尝试为基础数据记录分配一个随机的 4 位数字/字符串,并应用一个过滤器,该过滤器只汇总具有匹配规则的记录。

例如,如果随机字符串 > 8888,那么它将选择 8889 到 9999 之间的所有记录。

有任何想法吗?

0 投票
2 回答
4969 浏览

mysql - 将数据从mysql导入druid

我一直在使用 mysql 进行所有数据存储和查询。但是现在表格大小变得如此之高,有时需要几个小时才能获得结果。我已采取一切可能的措施,例如优化查询和正确索引表。

所以我一直在考虑用druid。我之前没有与德鲁伊合作过。我想我必须将所有表、数据从 mysql 导入 druid。我不明白我应该从哪里开始。因此,如果有人在任何形式的指导方面帮助我,我将不胜感激。提前致谢。

0 投票
1 回答
1655 浏览

counting - 如何将 hyperloglog 应用于时间序列流

有人可以解释或链接到有关如何使用 HLL 计算集合的基数可用于时间序列分析的解释吗?

我很确定druid.io确实做到了这一点,但我正在寻找一个关于如何单独使用 HLL 来做到这一点的一般解释,没有任何特定的库/数据库或特定的 HLL 实现。

一种天真的方法是在我们正在计算的事物上加上时间戳。例如,以redis HLL API 为例,如果您正在计算事件,从第 1000001 秒到第 1000060 秒:

这将遇到的一个问题是,您需要在给定范围内的每一秒进行迭代,以找出最后一分钟特定事件的计数。

0 投票
3 回答
3107 浏览

hadoop - 德鲁伊可以代替hadoop吗?

Druid 用于实时和批处理。但它可以完全取代hadoop吗?如果不是为什么?比如hadoop比德鲁伊有什么优势?我读过德鲁伊与hadoop一起使用。那么可以避免使用Hadoop吗?

0 投票
2 回答
2084 浏览

java - java.lang.NoClassDefFoundError: com/alibaba/druid/pool/DruidDataSourceFactory

我在我的 maven 项目中使用 druid 作为数据库连接池。我使用'maven package'来拥有一个jar包。然后我就运行它。但是,它有一个java.lang.NoClassDefFoundError例外。详细来说,就是

线程“主”java.lang.NoClassDefFoundError 中的异常:com/alibaba/druid/pool/DruidDataSourceFactory。

我在我的代码中发现了错误,我dataSource = (DruidDataSource) DruidDataSourceFactory.createDataSource(properties); 已尽力而为,但我仍然无法修复该错误。虽然我直接在eclipse中运行代码,但它不报告错误并且运行良好。

谢谢你的帮助

0 投票
2 回答
872 浏览

real-time - DRUID.io vs Esper CEP

过去几天我一直在阅读一些关于 Druid 的内容,想知道这与 Esper 有何不同。我一直在使用 Esper 进行实时事件处理。感觉 Druid 是通过其简单的类似 JSON 的查询和更简单的界面来做到这一点的。

有人可以纠正我并分享更多的光吗?

编辑
两者可以共存吗?

0 投票
1 回答
1470 浏览

java - java.sql.SQLException:sql注入违规,拒绝对象:dbms_random

作为标题,SQLException当我使用dbms_random这样的功能时,我得到一个:

但 SQL 在 PL/SQL 中正确执行。

此外,我使用的连接池是 Druid。

异常堆栈如下:

0 投票
0 回答
518 浏览

puppet - 如何从木偶脚本启动德鲁伊

我正在尝试在本地流浪机器上运行德鲁伊。我使用 puppet 来获取档案、提取它们等。但是在尝试运行历史节点和霸主节点时遇到问题。

我使用以下代码启动服务器:

}

但是由于以下错误,霸主和历史服务器都失败了:

知道如何解决这个问题吗?当我一个接一个地从命令行启动这些服务器时(我等到历史启动然后我启动霸主)一切正常。

0 投票
1 回答
282 浏览

amazon-s3 - 使用 Whirr 启动 Druid 集群

我正在尝试按照德鲁伊网站http://druid.io/docs/latest/Booting-a-production-cluster.html中的步骤使用 Whirr 启动德鲁伊集群

集群实例化了,但是不同的Druid节点(overlord、middleManager、history和coordinator)下载一些依赖导致失败有如下错误

无法在 io.druid.extensions:druid-s3-extensions:jar:0.6.115 收集依赖项

有没有人遇到过类似的问题或知道如何解决?

0 投票
3 回答
8683 浏览

cassandra - 德鲁伊能代替卡桑德拉吗?

我不禁认为 Cassandra 可以有效地服务于 Druid 的用例并不多。作为时间序列存储或键值,可以在 Druid 中编写查询以提取所需的数据。这里的论点更多是围绕证明德鲁伊而不是卡桑德拉。

除了在 Cassandra 中的 Fast 写入之外,真的还有别的吗?Esp 考虑到 Druid 的实时聚合/和查询功能,它是否比 Cassandra 更重要。

对于一个可以回答的更直接的问题 - Druid 是否提供了与 Cassandra 相同的功能的超集,并且立即使用 druid 不是更好吗?对于所有用例?