3

我正在使用实践存储库,准备与使用 BQ 的大型企业客户进行即将开展的工作。存储库链接是:google.com:analytics-bigquery:LondonCycleHelmet.ga_sessions_20130910

关于示例存储库和已运行的查询,我有 3 个问题要问(请参阅链接底部以获取引发问题的查询:

1)customDimensions.index、customDimensions.value和hits.customDimensions.index、hits.customDimensions.value有什么区别?

2) 如果单个点击有多个自定义维度/指标,如何返回/查询?我只在示例数据中看到匹配级别的单个维度。

3) 示例数据中没有传递自定义指标值,这些值会是什么样子?

以下是引发前 3 个问题的查询:

SELECT hits.page.pagePath AS urls,
       hits.time,
       customDimensions.index,
       customDimensions.value,
       hits.customMetrics.index,
       hits.customMetrics.value,
       trafficSource.medium,
       hits.customVariables.index,
       hits.customVariables.customVarName,
       hits.customVariables.customVarValue
FROM [google.com:analytics-bigquery:LondonCycleHelmet.ga_sessions_20130910]
4

1 回答 1

3

该表中的每条记录都代表一个 Google Analytics 会话。Big Query 具有嵌套字段的概念,这就是定义单个命中的方式。它们嵌套在点击记录中。

回答您的问题:

1) customDimensions.index 和 customDimensions.value 是用户或会话范围的自定义维度的索引和值。hits.customDimensions.index 和 hits.customDimensions.value 是在命中范围级别设置的自定义维度。范围是在您通过 GA 界面创建自定义维度时定义的。索引是从 1 到 20 的整数(在管理部分中定义),值是作为该自定义维度的值传递的字符串。有关自定义维度/指标的更多信息

2) rows 和 rows.customDimensions 都是 Big Query 中的 REPEATED RECORDS。所以本质上该 BQ 表中的每一行看起来像这样:

|- date
|- (....)
+- hits
   |- time
   +- customDimensions
      |- index
      |- value

但是,当您查询数据时,默认情况下应该是 FLATTEN。因为如果单个匹配具有多个自定义维度和指标,它应该显示多行,每行一个。

3) 应与 customDimensions 相同,但值为 INTEGER 而不是 STRINGS。

对于更简单且更具教育意义的数据集,我建议您创建一个全新的 BQ 表并加载此开发人员文档页面上提供的数据。

PS:告诉我在 Cardinal Path 的好朋友,Eduardo 说你好!

于 2013-11-06T05:54:43.900 回答