我使用 GCP Console 配置了 DLP 检查作业来扫描 PDF 和 DOCX 文件。它按预期工作,找到预期的实体并将结果保存到 BigQuery 表。
根据文档,DLP 对 PDF 和 DOCX 使用智能文档解析。这应该在DocumentLocation对象中为我提供其他位置详细信息。
我可以location.content_locations.document_location.file_offset
在 BigQuery 表中看到列,但它是空的。
我正在获取location.byte_range
TXT 文件和location.content_locations.image_location.bounding_boxes
图像的值,但没有文档的位置信息。
什么可能导致此问题?