4

如果它确实包含颜色,我需要将其转换为灰度 pdf。为此,我找到了一个脚本,可以确定 pdf 是否已经是灰度的。

convert "source.pdf" -colorspace RGB -unique-colors txt:- 2> /dev/null \
   | egrep -m 2 -v "#([0-9|A-F][0-9|A-F])\1{3}" \
   | wc -l

这会计算文档中存在多少具有不同 RGB 值(因此它们不是灰色)的颜色。

如果 pdf 还不是灰度文档,我将继续使用 ghostscript 进行转换

gs \
  -sOutputFile=temp.pdf \
  -sDEVICE=pdfwrite \
  -sColorConversionStrategy=Gray \
  -dProcessColorModel=/DeviceGray \
  -dCompatibilityLevel=1.4 \
  -dNOPAUSE \
  -dBATCH \
   source.pdf < /dev/null

如果我用 PDF 查看器打开输出文档,它会正确显示没有颜色。但是,如果我在新生成的文档上尝试第一个脚本,结果发现它仍然包含一些颜色。如何将文档转换为精确的灰度?我需要这个,因为如果我使用彩色打印机打印此文档,打印机将使用颜色而不是黑色来打印灰色。

4

2 回答 2

9

我通常非常重视 ImageMagick - 但不要相信convert使用您正在使用的命令正确计算颜色......

我可以建议一种不同的方法来发现 PDF 页面是否使用颜色?它基于一个(相对较新的)Ghostscript 设备,称为inkcov(您需要 Ghostscript v9.05 或更高版本)。它显示每个页面的 CMYK 墨水覆盖率(对于 RGB 颜色,它在内部进行到 CMYK 的静默转换)。

首先,在 Ghostscript 的帮助下生成一个示例 PDF:

gs \
  -o test.pdf \
  -sDEVICE=pdfwrite \
  -g5950x2105 \
  -c "/F1 {100 100 moveto /Helvetica findfont 42 scalefont setfont} def" \
  -c "F1                         (100% 'pure' black)   show showpage" \
  -c "F1 .5 .5 .5   setrgbcolor  (50% 'rich' rgbgray)  show showpage" \
  -c "F1 .5 .5 .5 0 setcmykcolor (50% 'rich' cmykgray) show showpage" \
  -c "F1 .5         setgray      (50% 'pure' gray)     show showpage"

尽管在人眼看来,所有页面都没有使用任何颜色,但第 2 页和第 3 页确实将它们的明显灰度值与颜色混合在一起。

现在检查每一页的墨水覆盖率:

gs  -o - -sDEVICE=inkcov test.pdf 
 [...]
 Page 1
 0.00000  0.00000  0.00000  0.02230 CMYK OK
 Page 2
 0.02360  0.02360  0.02360  0.02360 CMYK OK
 Page 3
 0.02525  0.02525  0.02525  0.00000 CMYK OK
 Page 4
 0.00000  0.00000  0.00000  0.01982 CMYK OK

(值 1.00000 对应于相应颜色通道的 100% 墨水覆盖率。因此0.02230,在结果的第一行中2.23 %,页面区域被黑色墨水覆盖。)因此 Ghostscript 给出的结果inkcov正是预期的结果:

  • 第 1 + 4 页不使用任何 C(青色)、M(洋红色)、Y(黄色)颜色,而仅使用 K(黑色)。
  • 第 2 + 3 页确实使用 C(青色)、M(洋红色)、Y(黄色)颜色的墨水,但根本没有使用 K(黑色)。

现在让我们转换原始 PDF 的所有页面以使用DeviceGray颜色空间:

gs \
 -o temp.pdf \
 -sDEVICE=pdfwrite \
 -sColorConversionStrategy=Gray \
 -sProcessColorModel=DeviceGray \
  test.pdf

...并再次检查墨水覆盖率:

gs -q  -o - -sDEVICE=inkcov temp.pdf
 0.00000  0.00000  0.00000  0.02230 CMYK OK
 0.00000  0.00000  0.00000  0.02360 CMYK OK
 0.00000  0.00000  0.00000  0.02525 CMYK OK
 0.00000  0.00000  0.00000  0.01982 CMYK OK

同样,在颜色转换成功的情况下,这正是预期的结果!(顺便说一句,你的convert命令2为我返回了两个文件,[原始]test.pdf和 [灰色转换]temp.pdf - 所以这个命令不可能是正确的......)

于 2012-05-06T23:00:21.953 回答
6

也许您的文档包含透明数字。尝试传递选项

-dHaveTransparency=false

到您的 ghostscript 转换命令。pdfwrite 设备的完整选项列表可在http://ghostscript.com/doc/current/Ps2pdf.htm#Options找到

于 2012-10-10T10:45:16.997 回答