我正在尝试破解特定的网络验证码。我打算通过分割字符并将它们传递给 ANN 来做到这一点(主要是为了特征,我将使用瞬间方法,因为似乎很难完全消除噪音)
验证码非常嘈杂,不幸的是,噪声与实际文本之间没有色差,因此基于颜色的分离不起作用。经过一番思考,我设法在验证码的像素上实现了一种填充样式算法,以分离小的断开连接的组件,之后我得到了这样的结果:
大部分噪音都消失了,但有些噪音留在了字母本身周围(因为它接触了文本)。我不是图像滤镜方面的专家,而且我发现很难找到合适的滤镜来减少剩余的噪点并增强字符。关于我可以为此目的使用什么过滤器的任何想法。
(注意:我没有为此使用任何图像处理工具/库。我正在编写原始像素操作代码,但考虑到它们的卷积核,我可以实现大多数过滤器)
问题是由于这种噪音,分割字符变得越来越困难。显然,试图找到没有暗像素的垂直线是行不通的,因为有噪音,而且有些字母是接触的。关于如何有效分割这些的任何想法?
编辑:原始图像