0

虽然我不能泄露太多这方面的信息,但我正在考虑制作一个很大的网站,并且会有很多 pdf 文件。但是,磁盘空间并不便宜。我将如何做到这一点,以便在不占用所有磁盘空间的情况下托管所有这些 pdf(用户也会发布它们)?

4

2 回答 2

0

也许对 PDF 的标记做一些检查?或者设置一个最大文件大小,可能是一组最大文件大小,具体取决于页面数量?

我正在使用 pdf2html 来处理(=从中获取文本)PDF 文件。

很难说... PDF 是否包含图像或其他会“缩小”kb 的数据?

于 2011-01-27T19:25:06.810 回答
0

这有点像问你如何储存数万亿加仑的盐水而不是创造海洋。真的做不到。充其量,您将管理您的资源以减少空间。例如,如果您的 PDF 可以转换为表单,那么它们只具有 xfdf 文件中嵌入图像的数据和链接,这可能会减少一个百分比。但当然有警告。1) 如果您的 PDF 不是表格并且不能标准化,这将不起作用。2)如果您的 PDF 大多只是 PDF 格式的图像,这根本不会有帮助。

于 2011-01-27T19:48:53.893 回答