0

https://cloud.google.com/document-ai/docs/process-forms,我可以看到一些处理单个文件的示例。但在大多数情况下,公司都有大量文件。在这种情况下,您如何扩展文档 AI 处理?您是否将文档 ai 与 Spark 结合使用?还是有其他方法?

4

1 回答 1

0

我只能找到以下内容:batch_process_documents处理许多文档并返回将保存在云存储中的异步响应。

从那里开始,我认为我们可以通过添加存储桶前缀的输入路径来参数化我们的工作,并将工作分配到多台机器上。

例如,所有这些都可以通过 Airflow 进行编排。

于 2020-07-30T11:24:45.300 回答