我正在努力确保我清楚地了解我的组织是如何为 Google Cloud Platform Dataproc 计费的。
我们已将帐单历史记录导出到 BigQuery,以便我们对其进行分析。今天早上,我们运行了两个 dataproc 集群,下面的屏幕截图显示了这两个集群的计费历史记录的子集。我已经过滤了labels.key = "goog-dataproc-cluster-uuid" or labels.key = "goog-dataproc-cluster-name" or labels.key = "goog-dataproc-location"。这是结果的子集
我已经围绕两种 sku 的成本绘制了方框。让我们看一下在 EMEA项目中运行的标准 Intel N1 16 VCPU 。
我只有两个集群,但这两个集群中的每一个都有三行。原因是每个 dataproc 集群应用了三个标签,因此成本1.271852和3.815556 分别出现了 3 次。
那么我的简单问题是......我如何获得我的 dataproc 集群的总成本?我是把所有这些数字加起来(因此意味着总成本在所有标签上平均分配)还是只取其中一个值(意味着每个标签重复成本)?
这是表达我的问题的另一种方式。data-dev-dataplatform-dataproc此查询是否给出了一天运行集群的总成本:
SELECT sum(cost)
FROM [dh-billing-179310:billing.gcp_billing_export_XXXXXXXX]
WHERE labels.key = "goog-dataproc-cluster-name"
and labels.value = "data-dev-dataplatform-dataproc"
and usage_start_time >= "2018-07-05 00:00:00"
and usage_end_time <= "2018-07-06 00:00:00"
还是我需要包含其他标签才能获得总成本?
