0

在过去的几个月里,我一直在使用 Google 的视觉 API 进行文本检测。API 返回特定图像/文档中存在的单词的“地图”。“地图”(JSON)中的每个元素都将包含一个单词的文本及其在文档中的坐标

之前的映射用于根据空格特殊字符将文本分解为单词......现在似乎基于空格将文本分解为单词。

例如,带有文本“Foo.Bar Hello World”的文档将有 4 个元素,即 4 个单词,因为“单词”也意味着在特殊字符上破坏文本......但现在“Foo.Bar Hello World”仅导致 3字。

我的问题是,有没有办法选择我们可以使用的 API 版本?或者有没有办法跟踪引入 API 的返回结构的更改/TEXT_DETECTION 模型中的更改?

我检查过的内容:

  1. https://cloud.google.com/vision/docs/release-notes -> 这包含整个 API 的版本,而不是为 OCR 运行的模型的更改或模型结果的“后处理”。
  2. cloud-vision-discuss 谷歌小组以解决类似问题。
4

2 回答 2

0

我们面临着完全相同问题。看看谷歌的答案难以置信

我们刚刚收到 Vision API 工程团队的更新,他们上周刚刚发布了一个新的 OCR 模型,他们告诉我们发布说明将很快发布。

工程团队还告诉我们,他们已经意识到这个问题,并且正在进一步调查。

因此,我已要求他们向我们提供有关 OCR 模型质量回归的最新信息。我们还向他们询问了使用以前模型版本的可能性。

对于 Vision API 团队何时会回复我们的回复,没有预计时间,但请期待我们最迟在本周末之前或在他们更新我们后尽快更新您。

于 2020-05-18T18:06:56.870 回答
0

现在(5 月 18 日)Google 已经更新了关于 15 日所做更改的发行说明。

https://cloud.google.com/vision/docs/release-notes?hl=en

简而言之:“错误标点”的问题将持续存在,并将成为正式的生产版本。从6月30日起,别无选择!

如果您有使用 Google Vision 的生产应用程序,请立即查看您的计划并做好应急准备。

在此处输入图像描述

于 2020-05-18T20:40:39.060 回答