我想对其余数据集使用与一个数据集相同的配方。所有数据集的结构/标题都是相同的。有没有办法在不重复所有步骤的情况下导入或重复使用相同的配方?
问问题
715 次
2 回答
1
在流视图页面中,您可以“交换”配方的数据源。如果您想对不同的数据源使用不同的后续步骤,您可以“复制”配方,然后交换复制的配方的数据源。
有关更多详细信息,请参阅https://cloud.google.com/dataprep/docs/html/Flow-View-Page_57344806
于 2017-10-29T08:57:29.903 回答
1
我刚刚开始使用 DataPrep,但据我了解,您可以在开始时将所有源输入到配方中,然后在最后将它们分叉出来并使用时间表来运行每个源。
假设您有五个结构相同但代表不同销售市场的输入文件。导入所有五个,如果没有market
列,则使用配方到derive
具有静态值的新列。
UNION
所有这些都放入配方中(因此核心配方接收一个文件)。
在配方的最后,为每个运行的输出添加一个新配方KEEP
,只保留该市场的数据。这将产生五个输出。
安排这些食谱中的每一个,当安排运行时,您将获得五种不同的输出 - 每个输入一个。
于 2017-11-23T17:25:14.617 回答