Business Insight: 我们处于教育领域,我们需要将标记图像(EPS) 自动转换为学生使用的交互式练习(使用 HTML/SVG/JavaScript)。
技术见解: 分层 EPS 文件是我们从出版商那里得到的。EPS 文件应转换为两个 PNG 文件:[1.png]只有标签文本[2.png]除标签文本外的所有其他文件。
然后[1.png]应该通过一些高级 OCR (?) 程序运行,该程序应该输出标签文本及其在图像中的位置(X,Y 坐标)。然后可以使用 HTML/JavaScript 将标签文本覆盖在[ 2.png] 上,以及使用 JavaScript 进行拖放等交互。
到目前为止尝试过: 手动将 EPS 转换为 PNG,并使用 ImageMagick 和 Tessaract OCR 单独获取标签文本。
问题: 图像处理的上述要求(EPS->PNG+带有坐标的文本标签)可以自动化到什么程度,可以使用哪些最佳工具?提前感谢帮助。
PS:我是一名 UI 开发人员,可以处理 HTML/JavaScript 部分,如果只为标签提供坐标。