2

我正在努力确保我清楚地了解我的组织是如何为 Google Cloud Platform Dataproc 计费的。

我们已将帐单历史记录导出到 BigQuery,以便我们对其进行分析。今天早上,我们运行了两个 dataproc 集群,下面的屏幕截图显示了这两个集群的计费历史记录的子集。我已经过滤了labels.key = "goog-dataproc-cluster-uuid" or labels.key = "goog-dataproc-cluster-name" or labels.key = "goog-dataproc-location"。这是结果的子集

在此处输入图像描述

我已经围绕两种 sku 的成本绘制了方框。让我们看一下在 EMEA项目中运行的标准 Intel N1 16 VCPU 。

我只有两个集群,但这两个集群中的每一个都有三行。原因是每个 dataproc 集群应用了三个标签,因此成本1.2718523.815556 分别出现了 3 次。

那么我的简单问题是......我如何获得我的 dataproc 集群的总成本?我是把所有这些数字加起来(因此意味着总成本在所有标签上平均分配)还是只取其中一个值(意味着每个标签重复成本)?


这是表达我的问题的另一种方式。data-dev-dataplatform-dataproc此查询是否给出了一天运行集群的总成本:

SELECT  sum(cost)
FROM [dh-billing-179310:billing.gcp_billing_export_XXXXXXXX] 
WHERE labels.key = "goog-dataproc-cluster-name"
  and labels.value = "data-dev-dataplatform-dataproc" 
  and usage_start_time >= "2018-07-05 00:00:00"
  and usage_end_time <= "2018-07-06 00:00:00"

还是我需要包含其他标签才能获得总成本?

4

1 回答 1

5

在计费出口数据的扁平视图中,每个标签的成本都是重复的;您应该为任何特定计算选择一个标签值。如果您尝试计算 Dataproc 总数,使用 Dataproc 插入的“goog-dataproc-*”标签之一可能最方便。

此处的想法是,您可以使用不同的标签集轻松组织归因于任何给定子项目的与 Dataproc 相关的总成本,以便您随后可以按不同维度过滤结算查询。

于 2018-07-06T16:16:27.087 回答