3

我一直在研究无需使用高级帐户即可导入 Google Analytics 原始数据的方法。到目前为止,这是我想做的最接近的链接 如何从 Google Analytics 中提取数据并从中构建数据仓库(webhouse) ? 我想使用 kibana 将该数据加载到弹性搜索和显示中。对此最好的 ETL 方法是什么?有没有人尝试使用 ELK 堆栈显示 GA 数据?

4

3 回答 3

0

看看这个:

https://www.elastic.co/guide/en/logstash/current/plugins-inputs-http_poller.html

您可以使用它来轮询端点,在本例中为 GA,并将响应数据加载到 Elasticsearch。您可能还想使用 Split 和/或 Mutate 插件过滤响应。

于 2017-04-04T21:30:15.780 回答
0

我做了同样的设置。

  1. 从 Google Analytics 中提取的数据有 7 个维度和 6 个指标,其中 2 个维度是主键(时间戳和 ID)。这是使用 R 完成的。
  2. 使用 linux awk 和 sed 命令对数据进行了一些转换。
  3. 使用行列格式将数据加载到 Apache Hive 中,总共创建了 9 个表。
  4. 使用 Hive Join 查询连接了 Hive 中的所有 9 个表,具有 2 个主键。
  5. 使用 elasticsearch-hadoop 连接器将最终生成的表加载到 elasticsearch。必须进行一些数据转换以匹配 Hive 和 Elasticsearch 数据类型。
  6. 使用 Kibana 可视化 Elasticsearch 中的数据。

现在我计划避免所有手动步骤,并以某种方式自动化上述所有步骤。

于 2018-08-13T19:06:14.133 回答
0

你应该做两次

于 2016-09-15T14:58:34.293 回答