0

我在尝试将 PDF 文件发送到 Microsoft 的 Form Recognizer 服务时遇到了一些麻烦。

我需要发送 PDF 文件,而不是发送 PDF 网址位置。根据我的经验,可以使用 base64 发送文件,但微软服务似乎与 base64 格式不兼容。每当我尝试发送文件时,服务器都会响应:

{“错误”:{“代码”:“1000”,“消息”:“输入文件无效。” } }

我需要知道如何将我的 PDF 转换为所需的应用程序/pdf“二进制 PDF 数据”。我找不到任何有关此转换的文档。

表单识别器 API 网页是:https ://brazilsouth.dev.cognitive.microsoft.com/docs/services/form-recognizer-api-v2-1-preview-3/operations/AnalyzeWithCustomForm

在这里您可以找到完整的文档网页:https ://docs.microsoft.com/en-us/azure/cognitive-services/form-recognizer/quickstarts/client-library?tabs=preview%2Cv2-1&pivots=programming-语言-rest-api

谢谢!

4

1 回答 1

0

您是正确的,不支持 base64 编码的请求。

如果您使用 curl 并且想要发送本地文件,请运行以下命令:

curl -i https://{endpoint}/formrecognizer/v2.1-preview.3/custom/models/{modelId}/analyze -H 'Content-Type: application/pdf' \
  -H 'Ocp-Apim-Subscription-Key: {subscription key}' --data-binary @/path/to/your/file.pdf

关键部分是Content-Type标题,它必须匹配支持的值,以及--data-binary标志,它是本地 PDF 文件的路径。请务必包含该-i标志,以便您可以Operation-Location在响应中看到标头,您可以在其中检索分析结果。

您可能还想查看C#JavaJavaScriptPython的表单识别器 SDK 。

于 2021-04-05T12:31:20.130 回答