5

是否可以从特定网站导出文本、图像和 LaTeX 方程,以便您可以直接自定义自己的 PDF 而不会使对象模糊?只有图像具有固定的分辨率。

我意识到有几种间接生成 PDF 的方法。例如,尝试在Riemann Zeta 函数上从 Wolfram MathWorld 渲染 PDF可以通过 Chrome 打印并保存为 PDF,但是当您放大时,LaTeX 方程和文本自然会变得模糊。我尝试下载“Wolfram 的 CDF 播放器”,但它只包含 Mathematica 库的语法——而不是 Wolfram MathWorld 提供的有用解释。我需要什么来提取 PDF 文件中的文本、图像和 LaTeX 方程而不使它们模糊?

4

3 回答 3

1

检查源代码显示,描述每个方程的 gif 具有近似于将呈现它们的 LaTeX 的替代文本(它可能是 Mathematica 代码——我不熟悉 Wolfram 的工具)。提取一个合理的来源不是不可能的,但这会很困难。该站点以表格布局,因此即使使用漂亮的汤之类的东西来解析 HTML 也可能很棘手。有些方程被分解成不同的 gif,因此解析它们会更加棘手。您还必须将替代文本转换为 LaTeX。

总而言之,如果您不需要做大量页面,我建议您复制粘贴文本、保存图像、获取每个图像的替代文本并自己进行转换。

于 2012-12-21T07:37:05.277 回答
1

除非您可以访问用于以您的问题不明显的方式生成图像的 LaTeX 源,否则答案是“您不能”。对链接网站的随意检查意味着用于生成方程式的 LaTeX 并不容易获得(它可能位于某个后端系统上,该系统会生成放置在 Web 服务器上的图像)。

对于浏览器来说,它只是一个图像。生成图像的方法与它在网页上的显示方式以及它在 PDF 中的显示方式无关(即比预期像素化程度更高)。

请注意,如果网站使用 SVG 之类的矢量图形格式而不是 PNG 或 JPEG 之类的基于像素的格式,那么这些格式将干净地转换为 PDF,并且可以很好地缩放。这是由相关网站的网站管理员做出的选择。

于 2012-12-21T07:12:22.373 回答
0

对于给定的示例,您可以下载该页面的 Mathematica 笔记本。也许可以从中解析出一些东西。

于 2012-12-22T20:15:21.093 回答