1

过去 10 天我一直在大查询中探索 Crux 数据集,以提取数据工作室报告的数据。虽然我认为自己擅长 SQL,因为我主要使用 oracle 和 SQL 服务器,但我发现很难针对这个数据集编写查询。我从Rick Viscomi 的这篇文章开始,探索了他的 github repo 上的查询,但仍然无法弄清楚。

我正在尝试使用物化表chrome-ux-report.materialized.metrics_summary来获取一些指标,但我不确定是否可以从此表中提取一段时间(例如月份)的 Min/Avg/Max lcp(以毫秒为单位)。我可以尝试哪些其他查询需要较少的数据处理。(我尝试的一些查询已过期我对大查询的免费数据处理 TB)。

任何建议,建议解决方案,查询都非常受欢迎,因为关于数据集结构和查询的文档不是很清楚。

4

1 回答 1

2

有关报告中使用的字段的详细信息,您可以查看chrome ux 报告的主要文档,特别是最后一部分的数据格式,其中显示了维度及其解释方式,如下所示:

Dimension
origin                          "https://example.com"
effective_connection_type.name  4G
form_factor.name                "phone"
first_paint.histogram.start     1000
first_paint.histogram.end       1200
first_paint.histogram.density   0.123

例如,上面显示了来自 Chrome 用户体验报告的示例记录,它表明 12.3% 的页面加载在加载“http://example.com”时的“首次绘制时间”测量范围为 1000-1200 毫秒”通过类似“4G”的连接在“电话”设备上。要获得第一次绘制时间低于 1200 毫秒的用户的累积值,您可以将直方图“结束”值小于或等于 1200 的所有记录相加。

对于指标,在初始链接中有一个称为方法的部分,您可以在其中获取有关报告指标和维度的信息。我建议转到每个国家和每个站点的实际来源表,而不是摘要,因为可以在那里获得您要查找的数据。在文档的Bigquery 部分,您将找到有关如何查询这些表的示例。我觉得这很相关:

SELECT
    SUM(bin.density) AS density
FROM
    `chrome-ux-report.chrome_ux_report.201710`,
    UNNEST(first_contentful_paint.histogram.bin) AS bin
WHERE
    bin.start < 1000 AND
    origin = 'http://example.com'

在上面的示例中,我们在“http://example.com”的 FCP 直方图中添加了所有密度值,其中 FCP bin 的起始值小于 1000 毫秒。结果为 0.7537,这表明大约 75.4% 的页面加载在一秒钟内经历了 FCP。

关于查询估算成本,您可以在 google 官方 bigquery 文档中查看估算查询成本指南。但是由于其性质,使用此表会消耗大量处理,因此请尽可能对其进行过滤。

于 2021-11-29T14:05:21.807 回答