我一直在研究无需使用高级帐户即可导入 Google Analytics 原始数据的方法。到目前为止,这是我想做的最接近的链接 如何从 Google Analytics 中提取数据并从中构建数据仓库(webhouse) ? 我想使用 kibana 将该数据加载到弹性搜索和显示中。对此最好的 ETL 方法是什么?有没有人尝试使用 ELK 堆栈显示 GA 数据?
问问题
6300 次
3 回答
0
看看这个:
https://www.elastic.co/guide/en/logstash/current/plugins-inputs-http_poller.html
您可以使用它来轮询端点,在本例中为 GA,并将响应数据加载到 Elasticsearch。您可能还想使用 Split 和/或 Mutate 插件过滤响应。
于 2017-04-04T21:30:15.780 回答
0
我做了同样的设置。
- 从 Google Analytics 中提取的数据有 7 个维度和 6 个指标,其中 2 个维度是主键(时间戳和 ID)。这是使用 R 完成的。
- 使用 linux awk 和 sed 命令对数据进行了一些转换。
- 使用行列格式将数据加载到 Apache Hive 中,总共创建了 9 个表。
- 使用 Hive Join 查询连接了 Hive 中的所有 9 个表,具有 2 个主键。
- 使用 elasticsearch-hadoop 连接器将最终生成的表加载到 elasticsearch。必须进行一些数据转换以匹配 Hive 和 Elasticsearch 数据类型。
- 使用 Kibana 可视化 Elasticsearch 中的数据。
现在我计划避免所有手动步骤,并以某种方式自动化上述所有步骤。
于 2018-08-13T19:06:14.133 回答
0
你应该做两次
- 首先,获取信息,一个非常有用的网站是https://developers.google.com/webmaster-tools/v3/how-tos/search_analytics但您必须首先拥有一个 google wembaster 工具帐户并在https上创建 oauth 凭据://console.developers.google.com/apis
- 然后一旦你有了你的数据,找到一种方法将它们导入弹性搜索,我仍在寻找最好的方法,也许将结果表转换为 csv,然后使用https://www.elastic.co/guide /en/logstash/current/plugins-filters-csv.html
于 2016-09-15T14:58:34.293 回答