我正在寻找使用 apache 梁来做以下事情。
专门针对张量流神经网络的预处理。
- 对于文件夹中的每个文件。
- 对于文件中的每一行
- 处理线到一维浮点列表
- 对于文件中的每一行
我需要每个返回是每个文件的二维浮点列表。
我想我可以通过创建嵌套管道来实现这一点。
我可以在另一个管道的 ParDo 内创建并运行一个管道。
这似乎效率低下,但我的问题似乎是一个非常标准的用例。
- 有没有工具可以在 apache Beam 中做得更好?
- 有没有办法重组我的问题以使其在 apache Beam 中更好地工作?
- 嵌套管道没有我想象的那么糟糕吗?
谢谢