我使用谷歌 AutoML 实体提取器创建了一个自定义处理器并训练了一些 pdf。Pdf 实际上包含照片身份证。我能够在他们的 UI 中对其进行测试,并且能够正确提取实体。现在我使用他们的 Java 客户端库使用下面给出的代码来完成它。这是示例
在这里,我看到他们将文本内容传递到库中,而不是我想发送 PDF 内容。我不想使用谷歌云存储桶,而是想在本地加载文件并将其发送到实体提取器。我尝试使用如下Document
类
Document.parseDelimitedFrom(FileInputStream("test.pdf"))
但它给了我一个错误。
任何帮助都是高度赞赏的。