c# - 用于屏幕文本的 OCR（光学字符识别）

Question

我正在尝试创建一个软件，通过捕获屏幕截图来自动化 PC，然后 OCR（光学字符识别）它寻找一个特定的按钮来点击（例如）。我有鼠标和键盘控制部分，但现在，我需要一个 OCR 来处理屏幕截图。我发现 Tesseract OCR 似乎不能很好地处理屏幕上的文本。文本太小，或者某些文本似乎是连接的，例如 K 和 X。我应该怎么做？

p/s：这是一个自动化测试程序。

score 0 · Accepted Answer

我不确定这是否真的适合你，但我在自动化中看到的一些更好的 OCR 是由 Tevron 的CitraTest完成的。它包含一个字体库，如果不存在字体集，他们将根据您提交的内容创建一个新字体集。此工具的不利因素是成本以及与可变屏幕分辨率相关的常见问题。

score 0 · Accepted Answer

也许在 OCR 之前看看这个关于图像增强的问题。否则，这个问题与"OCR for .NET"非常相似。

如果您感觉非常大胆，您可以随时提出一个简单的基于感知器或神经网络的方法 :-)

c# - 用于屏幕文本的 OCR（光学字符识别）

2 回答 2

Related

Reference