问题标签 [pdfbox]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
29433 浏览

java - 如何使用 PDFBox 使文本居中

我的问题很简单:如何使用 PDF 将文本居中PDFBox

事先不知道串,试了也找不到中间。字符串并不总是具有相同的宽度。

我需要:

  • 一种可以使文本居中的方法,例如addCenteredString(myString)
  • 一种可以给我以像素为单位的字符串宽度的方法。然后我可以计算中心,因为我知道 PDF 的尺寸。

欢迎任何帮助!

0 投票
2 回答
634 浏览

java - 将应用程序中的 PDF 附件转换为使用 PDFBox 以 HTML 格式打开它

我有一个应用程序,用户可以在某个页面上上传 PDF 文件。稍后当用户再次访问同一页面以编辑某些信息并希望查看附加的 PDF 文件时。不应下载并打开附加的 PDF 文件。相反,它应该直接在 HTML 中打开。

谁能帮我这个?谁能告诉我如何为此使用 PDFBox ?我是新手

这个应用程序是在java中。

或者还有其他更好的方法可以做到这一点吗?

0 投票
4 回答
10537 浏览

pdf - 两个pdf文件的比较

我需要比较两个几乎相似的文件的内容,并突出显示相应 pdf 文件中的不同部分。我正在使用pdfbox。请至少帮助我理解逻辑。

0 投票
1 回答
979 浏览

java - 找不到 jpype+pdfbox 类

我正在尝试使用 JPype 从 Python 调用 Apache Pdfbox,并且在实际导入类时遇到了一些困难。它似乎无法从类路径中的 jar 文件中读取它们。

此时,脚本错误如下:

我正在使用 Python 2.7 在 Linux 上运行,并且我知道 JPype 安装没有任何问题(如果有,流声明会出错)。我还尝试了类路径语句和 JPackage/JClass 语句的各种排列,似乎没有什么关系。任何建议将不胜感激!

0 投票
1 回答
1901 浏览

pdf - pdfbox 获取 begintext 部分(BT ET)坐标

有人可以帮我获取 pdf begintext 部分的真实像素坐标吗?我正在使用 pdfbox 从 pdf 文件中检索文本,但现在我需要获取围绕该文本部分/段落的矩形。

  • [PDFOperator{q}, COSFloat{690.48}, COSInt{0}, COSInt{0}, COSFloat{633.6}, COSInt{0}, COSInt{0}, PDFOperator{cm}, COSName{im1}, PDFOperator{Do} , PDFOperator{Q},

  • PDFOperator{BT}, COSInt{1}, COSInt{0}, COSInt{0}, COSInt{1}, COSFloat{25.92}, COSFloat{588.48}, PDFOperator{Tm}, COSInt{99}, PDFOperator{Tz}, COSName{F30}, COSInt{56}, PDFOperator{Tf}, COSInt{3}, PDFOperator{Tr}, COSFloat{0.334}, PDFOperator{Tc}, COSString{Pospremanj}, PDFOperator{Tj}, COSInt{0}, PDFOperator{Tc}, COSString{e}, PDFOperator{Tj}, COSFloat{9.533}, PDFOperator{Tw}, COSString{ i}, PDFOperator{Tj}, COSFloat{6.062}, PDFOperator{Tw}, COSFloat{0.95}, PDFOperator{Tc}, COSString{ ciscenj}, PDFOperator{Tj}, COSInt{0}, PDFOperator{Tc}, COSString{e }, PDFOperator{Tj}, COSInt{1}, COSInt{0}, COSInt{0}, COSInt{1}, COSFloat{55.68}, COSFloat{539.76}, PDFOperator{Tm}, COSInt{0}, PDFOperator{Tw}, COSFloat{0.262}, PDFOperator{Tc}, COSString{uoè}, PDFOperator{Tj}, COSInt{0}, PDFOperator{Tc}, COSString{i}, PDFOperator{Tj}, COSFloat{5.443}, PDFOperator{Tw},COSFloat{-2.145}, PDFOperator{Tc}, COSString{ zimslco}, PDFOperator{Tj}, COSInt{0}, PDFOperator{Tc}, COSString{g}, PDFOperator{Tj}, COSFloat{7.202}, PDFOperator{Tw} , COSFloat{-0.148}, PDFOperator{Tc}, COSString{ odmor}, PDFOperator{Tj}, COSInt{0}, PDFOperator{Tc}, COSString{a }, PDFOperator{Tj}, PDFOperator{ET},

  • PDFOperator{BT}, COSInt{1}, COSInt{0}, COSInt{0}, COSInt{1}, COSFloat{6.72}, COSFloat{513.12}, PDFOperator{Tm}, COSInt{0}, PDFOperator{Tw}, COSName{F30}, COSInt{14}, PDFOperator{Tf}, COSString{}, PDFOperator{Tj}, COSFloat{2.751}, PDFOperator{Tw}, ...

我想为每个单词/字符输出类似于 PrintTextLocations 函数的输出。我可以获得底部和左侧坐标,但如何获得宽度和顶部坐标?

打印文本位置:

  • String [25.92,45.19995 fs = 56.0 xscale = 55.440002高度= 40.208004空间= 15.412322宽度= 36.978485] p串[​​63.22914,45.119995 fs = 56.0 xscale = 55.440002高度= 40.208004 space = 15.412322宽度= 33.87384] O串[97.43364,45.19995 FS = 56.0 xscale = 55.440002高度= 40.208004宽度= 15.412322宽度= 30.824646] s弦[128.58894,45.119995 fs = 56.0 xscale = 55.440002高度= 42.168空间= 15.412322宽度= 33.87384] p串[​​162.79344,45.119995 fs = 56.0 xscale = 55.440002高度= 42.168空间= 15.412322宽度= 21.566162] R串[184.69026,45.119995 fs = 56.0 xscale = 55.440002高度= 42.168空间= 15.412322宽度= 30.82322宽= 30.824646] E串[215.84557,45.119995 FS = 56.0 xscale = 55.440002高度= 42.168空间= 15.412322宽度= 42.168空间= 15.412322宽度=49.286148]米...
0 投票
2 回答
11724 浏览

java - 如何在 Java 中将 PDF 转换为 JPEG?

我一直在尝试将 PDF 转换为 Java 中的图像 - 我尝试了 PDFBox,但它实际上转换的分辨率很差。

有没有其他方法可以用来将 PDF 转换为高质量的图像?

如果可以选择使用 PDFBox 执行此操作,您能否也给我一些示例代码?

我已经尝试这个超过1周了......

谢谢。

0 投票
6 回答
58670 浏览

java - Reading a particular page from a PDF document using PDFBox

How do I read a particular page (given a page number) from a PDF document using PDFBox?

0 投票
1 回答
3602 浏览

c# - 使用 PDFBox 填写 PDF 表单

我有一个带有表格的pdf。我正在尝试编写一个类,该类将从我的数据库中获取数据并自动填充表单中的字段。

我已经尝试过 ITextSharp 并且他们的定价超出了我的预算,即使它与我的 pdf 完美配合。我需要一个免费的 pdf 解析器,它可以让我导入 pdf、设置数据并保存 PDF,最好保存到一个流中,这样我就可以从我的类中返回一个 Stream 对象,而不是将 pdf 保存到服务器。

我找到了这个 pdf 阅读器,但它不起作用。空引用错误很多,当我尝试“修复”它们时,它仍然找不到我的字段。

所以,我已经转向 PdfBox,因为文档说它可以操作 PDF,但是,我找不到任何示例。这是我到目前为止的代码。

问题是catalog.getAcroForm()返回一个空值,所以我无法访问这些字段。有谁知道我如何使用 PdfBox 更改字段值并将其保存回来?

编辑:

我确实找到了这个例子,这几乎就是我正在做的事情。只是我的 acroform 在 pdfbox 中为空。我知道那里有一个,因为 itextsharp 可以把它拉出来就好了。

0 投票
3 回答
11707 浏览

java - 如何使用pdfbox提取文本内容的字体样式?

我正在使用 pdfbox 库从 pdf 文件中提取文本内容。我可以提取所有文本,但找不到提取字体样式的方法。

0 投票
2 回答
4153 浏览

jfreechart - 使用 JFreeChart 和 Apache PDFBOX 生成图表

我需要使用JFreeChart生成图表,然后使用Apache PDFBOX将它们导出为 PDF 。我不想使用 iText,因为它不能在专有软件中使用。

我搜索了整个谷歌,但没有运气!有人做过吗?