Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我对如何在互联网上挖掘信息以及如何从图像中提取文本感兴趣。
所以我正在寻找有关如何执行此操作的信息,我想自己编程。有没有什么论文可以很好地解释采矿和提取?
有人可以帮我吗?
亲切的问候,
您可以查看Tess4J哪个是Tesseract的 java 包装器。话虽如此,图像处理(文本提取)通常需要首先进行一些预处理,删除您知道不包含文本的颜色和部分是最常见的部分。
Tess4J