我被要求以类似于 Google 图书的方式在线出版一本完整的图书?即它可以查看和打印,但不能下载。
过程基本上是“高质量扫描”吗?是否有任何开源解决方案可以在这些高质量图像上“大量生成”“水印”。假设您有一个原始图像。当用户在线查看它时,我重新创建图像添加水印和图像顶部的一些其他文本“即时”在 python 中是否存在这样的库:)
有小费吗?如果你以前做过这个,请分享。
谢谢
我被要求以类似于 Google 图书的方式在线出版一本完整的图书?即它可以查看和打印,但不能下载。
过程基本上是“高质量扫描”吗?是否有任何开源解决方案可以在这些高质量图像上“大量生成”“水印”。假设您有一个原始图像。当用户在线查看它时,我重新创建图像添加水印和图像顶部的一些其他文本“即时”在 python 中是否存在这样的库:)
有小费吗?如果你以前做过这个,请分享。
谢谢
不幸的是,谷歌使用专利技术来扫描它的书籍,所以你可能不得不坚持传统的方法。
谷歌创造了一些非常漂亮的红外相机技术,当书被放置在扫描仪中时,它可以检测书页的 3D 形状和角度。该信息被传输到 OCR 软件,该软件会针对失真进行调整,并允许 OCR 软件更准确地读取文本。不再有破损的绑定,不再有低效的玻璃板。
基本上你需要使用 OCR 应用程序扫描这本书(tesseract 很好),然后我会从扫描的文本生成 PDF/图像,最后在顶部添加水印。Python Imaging Library似乎是最好的工具。
对 Google 图书了解不多,但Python Imaging Library可以做水印(有ASPN 配方)。
请参阅关于复制 Google 的照片 + 激光网格技术的斜线问题。