1

我在使用 Google Cloud Vision 的文本检测功能时遇到了以下问题:

1) 我使用相同的 Python 代码从 2 台不同的机器(基于 Windows 的开发机器和基于 Linux 的“生产”机器)向 Google Cloud Vision 提交相同的图像,但我得到了 2 个不同的输出。相同的图像,相同的代码,相同的库,但提取的文本不同。

2)我为两个不同检测的文本获得了两个不同的检测语言环境。我的原文是意大利文和数字混合。在开发机器上,检测到的语言环境是“zh”(中文)。在“生产”机器上,检测到的语言环境是“fil”。https://cloud.google.com/translate/v2/using_rest#language-params中没有任何“fil”代码,所以我不知道它是什么(菲律宾语?)。无论如何,当检测到的语言环境是“zh”时,我在开发机器上得到了更好的结果。所以......相同的图像,相同的代码,但检测到的语言环境和检测到的文本不同。

3)因此,我尝试使用 ImageContext languageHints 注释https://cloud.google.com/vision/reference/rest/v1/images/annotate#AnnotateImageRequest强制“it”或“zh”语言环境现在有趣的是:如果我在开发机器上将 languageHints 设置为 ['it'],我几乎没有从 Google Cloud Vision 得到任何输出。如果我将其设置为 ['ja'](日语),Google Cloud Vision 会说文本语言环境是“it”(!!),我会得到一些不错的结果(!!!)。但是,如果我在“生产”机器上设置 ['ja'],Google Cloud Vision 会说文本语言环境是“oc”(?)。所以......相同的图像,相同的代码,但检测到的语言环境和检测到的文本不同。此外,检测到的语言环境和文本不遵循我使用 languageHints 设置的内容,但是当我更改 languageHints 参数时,检测到的语言环境(和文本)也会以不可预知的方式发生变化。

你有什么提示吗?谢谢。

4

0 回答 0