是否有用于从png位图屏幕截图中提取文本的库等?
它适用于自动化程序,并且(例如)能够读取按钮等。我已经检查过 Tesseract,但它似乎是为图片制作的,而不是为电脑屏幕字体制作的。
如果您正在处理少量可能的匹配项(即:您想识别两个或三个不同的按钮),最简单的方法是隔离之前屏幕截图中的那些,将它们保存到单独的文件中,然后使用某种形式的模板匹配,这在 opencv 中很容易。
但是,如果您需要实际执行按钮文本的识别,您将需要一个 OCR 引擎。Tesseract 是一个很好的候选者,如果你可以为你的字体训练它(这是一个漫长的过程)。正如您所提到的,如果您正在处理一种小字体,您将需要这样做,而 tesseract 最初没有经过训练来识别。如果你不能,还有其他几个可以在 python 中使用的引擎,比如Ocropus