我们创建了一个管道,它正在对位于 GCS 中的 3 个流(“Clicks”、“Impressions”、“ActiveViews”)执行转换。我们需要将各个流写回 GCS,但要分开文件(稍后加载到 BigQuery),因为它们都有稍微不同的架构。
其中一个写入连续两次失败,每次都有不同的错误,这反过来导致管道失败。
这些是 GDC 以可视方式表示的最后 2 个工作流/管道,它们显示了失败:
第一个错误:
Feb 21, 2015, 12:55:14 PM (b0cbc05dfc56dbd9): Workflow failed. Causes: (f98c177c56055863): Map task completion for Step "ActiveViews-GSC-write" failed. Causes: (2d838e694976dc6): Expansion failed for filepattern: gs://cdf/binaries/tmp-38156614004ed90e-[0-9][0-9][0-9][0-9][0-9]-of-[0-9][0-9][0-9][0-9][0-9].avro.
第二个错误:
Feb 21, 2015, 1:20:15 PM (19dcdcf1fe125eeb): Workflow failed. Causes: (2a27345ef73673d3): Map task completion for Step "ActiveViews-GSC-write" failed. Causes: (8f79a20dfa5c4d2b): Unable to view metadata for file: gs://cdf/binaries/tmp-2a27345ef7367fe6-00001-of-00015.avro.
它只发生在“ActiveViews-GCS-Write”步骤中。
知道我们做错了什么吗?