2

最近,我一直在尝试使用 Python 3 中的 Google DLP API 对表格的内容进行分类。我首先在小示例上测试 API,所有这些都运行良好。但是,当我尝试发送更大的表(1000 行 x 18 列,小于 50 000 配额)时,请求会崩溃。在将表的大小减少到 100 行后,我确实设法让它运行,但是 100 行的单个请求大约需要 10 秒。大多数值都很短,您可以在下面找到一些列:

  • 地址
  • 出生日期
  • 电子邮件
  • 性别
  • 工作职位

此外,经过进一步的实验,我注意到如果同一个表以 CSV 格式的字符串形式提供(列由“,”分隔,行由“\n”分隔),运行时间减少了 10 倍。

这是正常行为吗?或者我是否可能使用不好的 api 导致如此糟糕的运行性能?

我希望我的问题足够清楚,感谢您花时间阅读本文!:)

4

1 回答 1

1

这是一个正在解决的已知问题。一些检测器(DOB 和名称检测器)在结构化数据上的工作速度比预期的要慢。

于 2018-07-29T20:55:40.543 回答