这是网站(https://appext20.dos.ny.gov/corp_public/CORPSEARCH.ENTITY_SEARCH_ENTRY)。我只想解决出现在该网站上的验证码?任何人都有任何想法。
提前致谢
这是网站(https://appext20.dos.ny.gov/corp_public/CORPSEARCH.ENTITY_SEARCH_ENTRY)。我只想解决出现在该网站上的验证码?任何人都有任何想法。
提前致谢
你不能。验证码的意思Completely Automated Public Turing test to tell Computers and Humans Apart
。因此,根据定义,无法自动解析 CAPTCHA,否则,它无法区分计算机和人类,因此无法成为 CAPTCHA。因此,您必须人工完成验证码并访问网站。
本站的验证码本来是电脑无法破解的,但现在这种验证码可以自动破解。
如何?有几种方法:
训练神经网络(通常是 CNN)来解决验证码。这需要几个 1000 个验证码及其训练解决方案,但这可以通过第三种方法轻松实现
这些验证码非常简单,甚至可以通过首先进行一些智能图像预处理然后修改一些标准 OCR 库来解决它们。
为了快速获得结果,第三方服务提供了一个 API,您基本上可以在其中发送图像并取回已解决的验证码。在内部,他们使用上述方法之一或点击获得报酬的工作人员手动解决验证码。