google-cloud-platform - 了解 GCP Dataproc 结算以及标签如何影响它

Question

我正在努力确保我清楚地了解我的组织是如何为 Google Cloud Platform Dataproc 计费的。

我们已将帐单历史记录导出到 BigQuery，以便我们对其进行分析。今天早上，我们运行了两个 dataproc 集群，下面的屏幕截图显示了这两个集群的计费历史记录的子集。我已经过滤了labels.key = "goog-dataproc-cluster-uuid" or labels.key = "goog-dataproc-cluster-name" or labels.key = "goog-dataproc-location"。这是结果的子集

我已经围绕两种 sku 的成本绘制了方框。让我们看一下在 EMEA项目中运行的标准 Intel N1 16 VCPU 。

我只有两个集群，但这两个集群中的每一个都有三行。原因是每个 dataproc 集群应用了三个标签，因此成本1.271852和3.815556 分别出现了 3 次。

那么我的简单问题是......我如何获得我的 dataproc 集群的总成本？我是把所有这些数字加起来（因此意味着总成本在所有标签上平均分配）还是只取其中一个值（意味着每个标签重复成本）？

这是表达我的问题的另一种方式。data-dev-dataplatform-dataproc此查询是否给出了一天运行集群的总成本：

SELECT  sum(cost)
FROM [dh-billing-179310:billing.gcp_billing_export_XXXXXXXX] 
WHERE labels.key = "goog-dataproc-cluster-name"
  and labels.value = "data-dev-dataplatform-dataproc" 
  and usage_start_time >= "2018-07-05 00:00:00"
  and usage_end_time <= "2018-07-06 00:00:00"

还是我需要包含其他标签才能获得总成本？

score 5 · Accepted Answer

在计费出口数据的扁平视图中，每个标签的成本都是重复的；您应该为任何特定计算选择一个标签值。如果您尝试计算 Dataproc 总数，使用 Dataproc 插入的“goog-dataproc-*”标签之一可能最方便。

此处的想法是，您可以使用不同的标签集轻松组织归因于任何给定子项目的与 Dataproc 相关的总成本，以便您随后可以按不同维度过滤结算查询。

google-cloud-platform - 了解 GCP Dataproc 结算以及标签如何影响它

1 回答 1

Related

Reference