2018年4 月 6 日, Google Cloud Vision API 添加了对文档文本检测中的 PDF 和 TIFF 文件的支持(请参阅发行说明)。
根据文档:
Vision API 可以检测和转录存储在 Google Cloud Storage 中的 PDF 和 TIFF 文件中的文本。
必须使用
asyncBatchAnnotate函数请求来自 PDF 和 TIFF 的文档文本检测,该函数执行异步请求并使用操作资源提供其状态。
PDF/TIFF 请求的输出被写入在指定的 Google Cloud Storage 存储桶中创建的 JSON 文件。
例子:
1) 将文件上传到您的 Google Cloud Storage
2) 发出 POST 请求以执行 PDF/TIFF 文档文本检测
要求:
POST https://vision.googleapis.com/v1p2beta1/files:asyncBatchAnnotate
Authorization: Bearer <your access token>
{
"requests":[
{
"inputConfig": {
"gcsSource": {
"uri": "gs://<your bucket name>/input.pdf"
},
"mimeType": "application/pdf"
},
"features": [
{
"type": "DOCUMENT_TEXT_DETECTION"
}
],
"outputConfig": {
"gcsDestination": {
"uri": "gs://<your bucket name>/output/"
},
"batchSize": 1
}
}
]
}
回复:
{
"name": "operations/9b1f9d773d216406"
}
3) 发出 GET 请求以检查文档文本检测是否完成
要求:
GET https://vision.googleapis.com/v1/operations/9b1f9d773d216406
Authorization: Bearer <your access token>
回复:
{
"name": "operations/9b1f9d773d216406",
"metadata": {
"@type": "type.googleapis.com/google.cloud.vision.v1p2beta1.OperationMetadata",
"state": "RUNNING",
"updateTime": "2018-06-17T20:18:09.117787733Z"
},
"done": true,
"response": {
"@type": "type.googleapis.com/google.cloud.vision.v1p2beta1.AsyncBatchAnnotateFilesResponse",
"responses": [
{
"outputConfig": {
"gcsDestination": {
"uri": "gs://<your bucket name>/output/"
},
"batchSize": 1
}
}
]
}
}
4) 在指定的 Google Cloud Storage 文件夹中查看结果