问题标签 [pdf]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
11 回答
4572 浏览

pdf - 从结构化数据生成 PDF

我希望能够从我可能在数据库或 xml 或任何其他结构化形式中的数据中生成高度图形化(也包含大量文本内容)的 PDF 文件。

目前,我们的平面设计师在将内容获取为 MS Word 文档后,在 Photoshop 中手动创建这些 PDF 文件。但通常,内容有20多个修改;这里和那里的小改动,拼写更正等。

两个缺点是: 1) 平面设计师的时间被不必要地占用。第一个版本是他/她唯一需要处理的版本。2) PDF 文件变成了现在有最终修改内容的文档,而初始内容与它不同步。因此,如果初始内容需要在其他地方(例如网站上),我们需要从 PDF 文件重新创建它。

生成 PDF 文件将帮助我解决这两个问题。也许图形设计师创建“模板”然后放入标签/持有者并将这些标签/持有者映射到相关数据的某种方式。

谢谢 :-)

0 投票
5 回答
3900 浏览

asp.net - 如何通过 ASP.NET 创建可编辑的 PDF

如何使用 ASP.NET 创建可编辑的 PDF。我想从主模板创建一个 Pdf,对其进行编辑(填充一些值(不是来自数据库的输入))并保存。不使用第三者可以吗?

如果有一些示例代码可用,那就太好了

0 投票
4 回答
27720 浏览

c# - 如何将 PDF 文件拆分为页面(最好是 C#)

我的客户有一个多页的 PDF 文件。他们需要按页面拆分。有谁知道这样做的方法 - 最好在 C# 中。

0 投票
13 回答
5301 浏览

xml - 用于格式化 XML DocBook 的推荐工具链是什么?

我见过Best tools for working with DocBook XML 文档,但我的问题略有不同。当前推荐的 XML DocBook 格式化工具链(与编辑工具相对)是哪个?

在 Eric Raymond 的2003 年的“The Art of Unix Programming”(一本优秀的书!)中,建议是 XML-FO(XML 格式化对象),但我在这里看到的建议表明 XML-FO 不再处于开发阶段(虽然我在 StackOverflow 上找不到那个问题,所以可能是错误的)。

假设我主要对 Unix/Linux(包括 MacOS X)感兴趣,但我不会自动忽略仅限 Windows 的解决方案。

Apache 的 FOP是最好的方法吗?有没有其他选择?

0 投票
3 回答
27324 浏览

wpf - WPF转PDF

我有一个 WPF 应用程序,我希望能够将应用程序的输出保存到 PDF 文档,我要保存的项目可以是 Visual a Drawing 或 FixedDocument(我可以将其创建为这些选项中的任何一个,并且它们之间的转换很容易)。

是否有任何库可以直接从 WPF 转换为 PDF(无需编写代码来遍历可视化树并使用 PDF 原语重新创建它)。

0 投票
3 回答
1675 浏览

pdf - Postscript 有表格的概念吗?

我想要实现的是确定我正在解析的 Postscript 是否包含驻留在表(框)中的任何元素。

我问它是否有内置的方式来在页面上布置表格数据。我的猜测是 postscript 没有表格的概念,因为我在规范中的任何地方都找不到它。

我需要解决的问题是,我需要找到一种方法来知道某些后记是否位于表格内。

0 投票
5 回答
94105 浏览

url - 是否可以使用 URL 参数链接到 PDF 中的书签?

在网站上提供指向 PDF 文件的链接时,是否可以在 URL(请求参数)中包含信息,这将使 PDF 浏览器插件(如果使用)跳转到特定的书签,而不仅仅是在开头打开?

像:http ://www.somehost.com/user-guide.pdf?bookmark=chapter3 ?

如果不是书签,是否可以转到特定页面?

我假设如果有答案,它可能特定于 Adob​​e 的 PDF 阅读器插件或其他东西,并且可能有版本限制,但我最感兴趣的是该技术是否存在。

0 投票
7 回答
58102 浏览

pdf - PDF 中的 Unicode

我的程序根据要求生成相对简单的 PDF 文档,但是我遇到了 unicode 字符的问题,比如汉字或奇怪的数学符号。要在 PDF 中编写普通字符串,请将其放在括号中:

还可以选择使用八进制代码转义字符:

但这最多只能包含 512 个字符。你如何编码或转义更高的字符?我看过对字节流和十六进制编码字符串的引用,但我读过的所有引用似乎都不愿意告诉我如何实际去做。


编辑:或者,给我指出一个很好的 Java PDF 库,它将为我完成这项工作。我目前使用的是 gnujpdf 的一个版本(我已经修复了几个错误,因为原作者似乎已经离开了),它允许您针对 AWT 图形界面进行编程,理想情况下任何替换都应该这样做相同。

替代方案似乎是 HTML -> PDF,或基于段落和框的编程模型,感觉非常像 HTML。iText 是后者的一个例子。这意味着重写我现有的代码,我不相信他们会给我同样的布局灵活性。


编辑 2:我之前没有意识到,但是 iText 库有一个 Graphics2D API,并且似乎可以完美地处理 unicode,所以这就是我将要使用的。虽然这不是问题的答案,但它为我解决了问题。


编辑 3: iText 对我来说工作得很好。我想教训是,当面对看似毫无意义的困难时,寻找比你更了解它的人。

0 投票
3 回答
3918 浏览

.net - 如何让 ImageMagick 与 Ghostscript 对话

我在 Windows XP 上。

我正在使用 ImageMagick (MagickNet) 将 PDF 转换为 TIF。

我的问题是,当我在 MagicNet.Image 对象中加载 PDF 时,它不会抛出错误,但是当我查看属性时,很明显它没有加载 PDF(它不包含任何数据)。

我的猜测是 ImageMagick 没有与 Ghostscript 交谈。

有任何想法吗?

--我忘了提,我确实安装了Ghost Script,并将它的bin文件夹添加到PATH

0 投票
6 回答
6890 浏览

perl - 如何从 Perl 对 PDF 文件进行全文搜索?

我有一堆 PDF 文件,我的 Perl 程序需要对它们进行全文搜索以返回哪些包含特定字符串。迄今为止,我一直在使用这个:

其中 $string 是要查找的文本。然而,这对于大多数 pdf 文件来说都失败了,因为文件格式显然不是 ASCII。

我能做什么最简单?

澄清:大约有 300 个 pdf 的名称我事先不知道。PDF::Core 可能是矫枉过正。我试图让 pdftotext 和 grep 相互配合,因为我不知道 pdf 的名称,我还找不到正确的语法。

使用 Adam Bellaire 的以下建议的最终解决方案: