我注意到有一个选项允许指定机器类型。我应该使用什么标准来决定是否覆盖默认机器类型?
在一些实验中,我发现较小的实例的吞吐量更好,但另一方面,当使用许多小实例而不是较少数量的默认实例时,作业往往会遇到更多的“系统”故障。
谢谢,G
我注意到有一个选项允许指定机器类型。我应该使用什么标准来决定是否覆盖默认机器类型?
在一些实验中,我发现较小的实例的吞吐量更好,但另一方面,当使用许多小实例而不是较少数量的默认实例时,作业往往会遇到更多的“系统”故障。
谢谢,G
Dataflow 最终会为您优化机器类型。同时,这里有一些我能想到的场景,您可能想要更改机器类型。
如果您的 ParDO 操作需要大量内存,您可能需要将机器类型更改为 Google Compute Engine 提供的高内存机器之一。
优化成本和速度。如果您的 CPU 利用率低于 100%,您可以通过选择 CPU 更少的机器来降低工作成本。或者,如果您增加机器数量并减少每台机器的 CPU 数量(因此总 CPU 大致保持不变),您可以使您的作业运行得更快,但成本大致相同。
您能否详细说明您所看到的系统故障类型?一大类故障(例如 VM 中断)是概率性的,因此随着机器数量的增加,您会期望看到更大的故障绝对数量。但是,像 VM 中断这样的故障应该是相当罕见的,所以如果您注意到增加,我会感到惊讶,除非您使用更多数量级的 VM。
另一方面,由于使用更多机器的并行性增加,您可能会看到更多的失败,因为资源争用。如果是这种情况,我们真的很想知道这是否是我们可以解决的问题。