0

当我使用Forms Recognizer的 API 时,它返回了一个 JSON 文件。现在,我将表单识别器与 SDK 和 Python 结合使用,它返回的数据类型似乎是库 azure.ai.formrecognizer 中的特定数据类型。

有谁知道如何将从Form Recognizer SDK Python 获取的数据保存在 JSON 文件中,就像从Form Recognzier API收到的文件一样?

from azure.ai.formrecognizer import FormRecognizerClient
from azure.identity import ClientSecretCredential

client_secret_credential = ClientSecretCredential(tenant_id, client_id, client_secret)
form_recognizer_client = FormRecognizerClient(endpoint, client_secret_credential)
with open(os.path.join(path, file_name), "rb") as fd:
    form = fd.read()
poller = form_recognizer_client.begin_recognize_content(form)
form_pages = poller.result()
4

1 回答 1

3

谢谢你的提问!适用于 Python 的 Azure 表单识别器 SDK 提供了模型上的to_dict和之类的帮助方法,from_dict以方便将库中的数据类型转换为字典和从字典转换。您可以to_dict直接使用从该方法获得的字典或将其转换为 JSON。

对于上面的示例,为了获得 JSON 输出,您可以执行以下操作:

poller = form_recognizer_client.begin_recognize_content(form)
form_pages = poller.result()

d = [page.to_dict() for page in form_pages]
json_string = json.dumps(d)

我希望能回答您的问题,如果您需要更多与图书馆相关的信息,请告诉我。

此外,在我们的文档页面上还有关于我们的模型及其方法的更多信息。您可以使用下拉菜单选择您正在使用的库的版本。

于 2021-11-04T01:02:52.583 回答