我有一个很长的文本文件(几百 GB),我想改组其中的行。我想知道是否有使用 DataFlow 的好方法。我想如果我只是将文件放入并有一个运行仅输出行的 DoFn 的 ParDo,我会得到一个小的洗牌。但最好对文件进行更全面的改组。有什么好主意吗?
问问题
126 次
我有一个很长的文本文件(几百 GB),我想改组其中的行。我想知道是否有使用 DataFlow 的好方法。我想如果我只是将文件放入并有一个运行仅输出行的 DoFn 的 ParDo,我会得到一个小的洗牌。但最好对文件进行更全面的改组。有什么好主意吗?