0

目前我正在使用 selenium 和 autoit 编写用于 Web 自动化的软件。

我发现了一个奇怪的问题,当使用 Firefox 打印到 pdf 时,某些页面会出现无法搜索的 pdf。我试过 ff 3.5、4.0、20、22、23 - 都有同样的问题。

您可以通过打印任何linkedin 配置文件来复制它——您将获得无法搜索的pdf。

有没有人遇到过同样的行为?我怎样才能绕过它(使用python、selenium)?我已经尝试过 chrome 驱动程序,但速度非常慢。

我正在运行 Windows 7 x64 Ultimate 它与使用的打印机无关 - 我尝试了很多不同的版本。可搜索是指我应该能够像在大多数 pdf 文件中一样搜索其中的文本。

更新- 我仍然不明白为什么会这样。我尝试从 IE 9 打印相同的网页 - 它提供与 firefox 完全相同的打印对话框,并使用相同的 pdf 打印机驱动程序。不过,它会生成可搜索的 pdf。猜猜这个问题与Firefox打印文档的方式有关。

4

1 回答 1

1

Firefox 无法控制您的内容打印到 PDF 的方式。您的 PDF 打印机驱动程序负责将 PDF 文件创建为页面的位图快照,而不是从页面中的元素组合它。与 Firefox 相比,您在 Chrome 中发现不同行为的原因是 Chrome 具有内置的“另存为 PDF”,这与您安装的 PDF 驱动程序不同。所以这真的取决于您使用的是什么 PDF 打印机驱动程序。

于 2013-05-08T15:37:11.467 回答