所以这里有一个问题和疑问:
我正在分析 HTML5 Canvas 上的文档页面并检测某些功能,例如框、标签、文本块、图像、表格等。因为 Canvas 的像素读/写速度很慢,并且图像需要永远是高分辨率的精度例如:1500 x 2500,我无法分析每个像素,更不用说多次通过了。
我的算法做了一些随机像素戳,并做了一些最小的分析,以查找是否有可用的边界框进行进一步处理以及需要完成的处理类型;某些部分可能会发送到服务器,例如 OCR。
随后的每一次随机戳都会检查越来越多的成功找到的边界框,然后戳到其他地方,直到进入未知水域。该技术出奇地简单和有效,但这会导致大量额外的随机戳,并且如果没有大量戳数(1% 的区域)就无法提供一致的结果,即使这样它也会间歇性地遗漏一些部分。
最好是实现一些空间分析算法,它可以告诉我未戳区域在所有边界框之外的位置,这样我就可以将我的 x/y 随机坐标选择限制在那里。它应该会显着提高功效和速度。
我对完整分析的文档页面的典型框数是 < 200。
公共领域/维基中是否存在任何可以在 JavaScript 中相当快地做到这一点的算法?