背景
这个想法是这样的:
- 个人提供在线购书的联系信息
- 书籍,作为 PDF,标有唯一的哈希
- 人下载书
- PDF 密码易于绕过或共享
理想的过程是这样的:
- 根据联系信息生成哈希
- 在数据库中存储联系信息和哈希
- 获得书锁
- 使用散列文本更新“包含”文件
- 将书籍生成为 PDF(使用
pdflatex
) - 将哈希应用于预订
- 释放书锁
- 发送带有图书下载链接的电子邮件
技术
可以使用以下技术(也可以使用其他编程语言,但库可能仅限于主机提供的那些):
- C、Java、PHP
- 乳胶文件
- PDF 文件
- Linux
问题
我应该调查哪些编程技术(或开源软件):
- 将唯一的哈希(或其他标记)嵌入到 PDF
- 创建防串通攻击标记
- 开发一个不易碎(例如,
PDF -> EPS -> PDF
仍然包含标记)的解决方案
研究
我研究了以下可能性:
- 隐写术
- 自然语言处理 (NLP)
- 将 PDF 中的空白页转换为图像;标记这些图像;重新组装 PDF
- LaTeX 水印包
- ImageMagick
问题
我研究过的可能解决方案有以下问题:
- 隐写术。(a) 需要图像的主副本,将其转换为 EPS,这是 CPU 密集型和耗时的;(b) 水印能否保留
PDF -> EPS -> PDF
,或其他类型的转换;(c) 大多数图像是图纸或屏幕截图,而不是 PNG 格式的照片。 - 乳胶。创建图像缓存;任何隐写解决方案都必须以某种方式拦截该过程。
- 自然语言处理。引入语法错误;可以改变技术词的含义。
- 空白页。立即怀疑;替换可疑的空白页很容易。
- 水印包。绘制可见标记。
- 图像魔术。绘制可见标记。
还有哪些可能的解决方案?
相关链接
谢谢!