问题标签 [pdfclown]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
78 浏览

pdfclown - 如何确定文本是否适合框架?

我有一个框架并使用 BlockComposer 将多行文本写入框架。行的文本由用户输入决定,所以我事先不知道它们将包含多少个字符。

我怎么知道所有的线条是否都适合框架,或者它们是否会溢出框架的高度?

下面的例子是用 Scala 编写的,它使用 pdfclown java:

0 投票
1 回答
282 浏览

c# - 使用 PDFClown (.net 版本) 列出嵌入的字体

有没有办法使用 PDFClown 库获取 PDF 文件中的嵌入字体列表?目的是检查它是否不是扫描的 PDF,如果它没有嵌入字体,则假设它是扫描的文档。

提前致谢

0 投票
0 回答
509 浏览

c# - 使用 PDFClown 将文本转换为 PDF

请告诉我如何使用 PDF Clown 库将文本转换为 PDF。我第一次使用 pdflown 库。有没有办法使用这个库将我的字符串绑定到 PDF。

0 投票
1 回答
1513 浏览

c# - PDF Clown 不呈现文本

我使用PDF Clown创建包含文本和不同形状的 PDF 文件。保存文件会带来所需的结果。但是当我打印页面或将它们渲染为位图时,只有形状可见并且缺少文本元素。

我已经用多个文件尝试了不同版本的库,总是得到相同的结果。

也许有人可以就这个问题给我一个提示。

编辑:

这是我使用的源代码的简化形式(结果与上述相同;见最后的图片):

上述代码的结果(打印版本是用虚拟打印机Adob​​e PDF创建的;也用XPS Document Writer测试过):

在此处输入图像描述

0 投票
1 回答
584 浏览

pdfclown - 如何使用 PDFClown 从 PDF 文件中删除对象

我有一个包含很多不可见路径的 pdf。由于路径的数量稍后会产生问题,因此我想删除具有白色的路径。

到目前为止,我正在尝试使用ContentScanner

它可以正确识别路径,但最终这些路径并未从 PDF 中删除。这里是处理 PDF 的代码(它只从源 pdf 中提取一页):

保存的 PDF 文件仍然包含我试图删除的路径。最后如何从 PDF 中删除对象?

谢谢,托马斯

0 投票
1 回答
105 浏览

c# - PDFClown .NET 打开 Windows 资源管理器而不是指定路径

目前我有这个测试代码

如何打开一般 Windows 资源管理器另存为提示而不是保存到硬代码路径“test.pdf”?(在file.save()

谢谢

0 投票
0 回答
149 浏览

pdfbox - 想将pdf页面的内容添加到另一个pdf

我有两个数据有限的 pdf,即单页。我想将一个 pdf 的数据合并到另一个 pdf 但在单个页面上(它不应该创建另一个页面来附加外部数据)。有没有办法使用 pdfbox 或 pdfclown 做到这一点?

0 投票
1 回答
327 浏览

java - PDFClown 一行不同的字体大小

我正在使用 PDFClown 来分析 PDF 文档。在许多文档中,PDFClown 中的某些字符似乎具有不同的高度,即使它们显然具有相同的高度。有解决方法吗?

这是代码:

这是一个示例 PDFDocument:

例子

在本文档中,我标记了两个文本块,它们都包含“百万”一词。在分析“百万”中每个字符的大小时,会发生以下情况:

  1. 第一个标记中的“m”具有高度:14,50 和宽度:8,5
  2. 第一个标记中的“i”具有高度:14,50 和宽度:3,0
  3. 第一个标记中的“l”具有高度:14,50 和宽度 3,0
  4. 第二个标记中的“m”具有高度:10,56 和宽度:6,255
  5. 第二个标记中的“i”具有高度:10,56 和宽度:2,23
  6. 第二个标记中的“l”具有高度:10,56 和宽度:2,23

即使两个文本块的所有字符显然具有相同的大小 pdf 小丑说大小是不同的。

0 投票
1 回答
331 浏览

java - PDF Clown Highlight Multiple search word is failed for PDF contains images, color text, Complex Diagrams

我正在使用 PDFClown 突出显示 PDF 文档中的多个搜索词。在许多包含彩色图像、复杂图表、彩色文本的 pdf 文档中,PDFClown 会在那里抛出异常并且无法突出显示匹配的单词。提到的代码适用于普通或简单的 Pdf。

这是我用于测试的 PDF https://drive.google.com/file/d/0B-nuOO6Zsa4rXy1DS2JjX1RnYmM/view?usp=sharing

这是堆栈跟踪

0 投票
1 回答
86 浏览

java - PDFClown:创建 TextMarkup 会导致 TextMarkup 的框不准确

我正在使用 PDFClown 来分析和使用 PDFDocuments。我的目标是突出显示表格中的所有数字。对于属于一起的所有数字(例如:表格一列中的所有数字),我将创建一个带有四边形列表的 TextMarkup。首先,看起来everythink 运行良好:左侧的所有高亮属于一个TextMarkup,右侧的所有高亮属于另一个TextMarkup。

高亮文本

但是在分析 TextMarkup 的大小时,大小比它看到的图片要大。因此,当在左侧 TextMarkup 框周围绘制一个矩形时,尽管左侧 TextMarkup 没有突出显示与另一列相交,但该矩形与另一列相交。有没有办法优化 TextMarkup 的 Box?我认为盒子有一个球根状的结尾,所以盒子与另一个 TextMarkup 相交

这是创建 TextMarkup 的代码:

这是一个示例文件示例

谢谢你 !!