4

我正在尝试创建一个软件,通过捕获屏幕截图来自动化 PC,然后 OCR(光学字符识别)它寻找一个特定的按钮来点击(例如)。我有鼠标和键盘控制部分,但现在,我需要一个 OCR 来处理屏幕截图。我发现 Tesseract OCR 似乎不能很好地处理屏幕上的文本。文本太小,或者某些文本似乎是连接的,例如 K 和 X。我应该怎么做?

p/s:这是一个自动化测试程序。

4

2 回答 2

0

我不确定这是否真的适合你,但我在自动化中看到的一些更好的 OCR 是由 Tevron 的CitraTest完成的。它包含一个字体库,如果不存在字体集,他们将根据您提交的内容创建一个新字体集。此工具的不利因素是成本以及与可变屏幕分辨率相关的常见问题。

于 2009-07-24T11:50:43.267 回答
0

也许在 OCR 之前看看这个关于图像增强的问题。否则,这个问题与"OCR for .NET"非常相似。

如果您感觉非常大胆,您可以随时提出一个简单的基于感知器或神经网络的方法 :-)

于 2009-05-22T03:24:03.863 回答