我想做一些能够识别屏幕上不同物体的东西。假设我在带有文本字段、标签和按钮的窗口上截屏。我想传递图像,它应该能够区分一个和另一个。换句话说,它应该将名称'textfield'放在文本字段所在位置的顶部,'button'放在按钮顶部,'label'放在标签顶部。
这是来自互联网的示例图像,用于可视化“注册窗口”: http: //kb.parallels.com/Attachments/12828/Images/registration1.jpg
我想在 Java 中做到这一点,但我不确定这是否可能。有谁知道我应该从哪里开始寻找?边缘检测?特征检测?OCR/ICR?
这已经存在了吗?以前有人遇到过这样的事情吗?
有人可以指出我正确的方向吗?我将不胜感激。
谢谢!:)