3

我有分析服务器(例如点击计数器)。我想使用一些 api 向德鲁伊发送数据。我该怎么做?我可以用它代替谷歌分析吗?

4

4 回答 4

4

正如 se7entyse7en 所说:

您可以将数据摄取到 Kafka,然后使用 druid 的Kafka firehose通过实时摄取将数据摄取到 druid。之后,您可以使用其 api 交互式查询 druid。

必须说,firehoses 只能在 Druid实时节点上设置。

这是一个如何设置 Kafka firehose 的教程:Loading Streaming Data。除了 Kafka firehose,您还可以设置其他提供的 firehose - Amazon S3 firehose、RabbitMQ firehose 等...通过包含它们,您甚至可以编写自己的 firehose 作为扩展,示例如下这里是所有德鲁伊扩展

必须说,Druid 正在将实时摄取实时节点转移到Indexing 服务,如此所述。

于 2015-12-15T12:47:00.697 回答
3

现在最好的做法是在Indexing Service上运行 Realtime Index Task ,然后您可以使用 Druid 的 API 将数据发送到此任务。您可以直接使用 API,但使用Tranquility要容易得多。它是一个库,将自动为新段创建新的实时索引任务,它允许您将消息发送到正确的任务。您还可以设置复制和分片级别等。只需运行索引服务,使用 Tranquility,您就可以开始向 Druid 发送消息。

于 2015-08-25T20:10:50.103 回答
2

您可以将数据摄取到 Kafka,然后使用 druid 的 Kafka firehose 通过实时摄取将数据摄取到 druid。之后,您可以使用其 api 交互式查询 druid。

于 2015-08-04T16:36:03.700 回答
0

考虑到你的德鲁伊是 0.9.x 版本,最好的使用方式是宁静。其余的 api 非常可靠,允许您控制数据模式。druid.io快速入门页面并点击“加载流数据”部分。

我正在实时加载我们网站的点击流数据,并且运行良好。所以,是的,你可以用德鲁伊替换谷歌分析(假设你有所需的基础设施)。

于 2017-02-23T20:22:00.603 回答