问题标签 [pdfclown]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
174 浏览

java - pdfclown:如何覆盖 pdfclown 中现有的高亮关键字

我在 pdfclown 中得到了要求,例如如果有几个关键字是子字符串/与另一个关键字匹配,而突出显示这些关键字必须被覆盖并且应该允许突出显示完整的关键字。例如在下面的地图 ETS 关键字是 just.ETS 的子字符串和 Test.ETS 关键字。并且预期结果应该像我们需要突出显示完整的关键字,例如 just.ETS , Test.ETS 而不是 ETS 关键字及其弹出度量值。. ActualPdf实际结果 pdf。和jar 路径

(注意:1.如果文件中已经突出显示大尺寸关键字,那么与大关键字匹配的小尺寸关键字不应突出显示2.如果小尺寸关键字已经突出显示并且该关键字与大关键字匹配,那么大关键字应该突出显示并忽略/取消突出显示小关键字。)。

0 投票
2 回答
273 浏览

pdfclown - PDFClown 复制注释然后操作它们

我需要将注释从一个 PDF 文件复制到另一个。我使用了优秀的 PDFClown 库,但无法操作颜色、旋转等。这可能吗?我可以看到基本对象信息,但也不确定如何直接操作。

我可以通过克隆外观来复制外观,但不能“编辑”它。

提前致谢。亚历克斯

PS如果Stephano作者正在上市,项目死了吗?

0 投票
1 回答
501 浏览

java - Pdfclown - pdf文件的几种不同字体无法识别,我也遇到异常

当很少有 pdf 文件不是英文并且他们的字体无法识别并且我遇到异常时,我经常遇到 pdfclown 的问题。请找到pdf 路径代码路径。在 CompositeFont.java 和 SimpleFont 中加载编码方法都失败。爪哇。是否有任何特定版本的 jar 我需要用于解决此问题。请提供您的意见以支持此类 pdf 文件。

*****************************其他pdf问题****************** ******************************

************************************另一个问题****************** ***********************

0 投票
1 回答
1191 浏览

c# - 从pdf中提取文本信息

如何提取文本信息,如文本位置坐标、宽度、高度等??我用'Pdf clown'库尝试了这个,它对于普通文本非常有效,但是对于 旋转文本(90/-90度),它输出宽度/高度为0(零)。

并且 (90/-90 度) 文本的缩放因子(scaleX, scaleY) 分别显示为 (0, 0),而对于反转文本 (旋转 180 度),它是 (-1, -1)。

我想要旋转文本的信息来突出显示它们(因为宽度值为零,我无法突出显示它们)。请帮我。我正在研究.NET 环境。

我正在使用的文件: https ://nofile.io/f/Kvf2DkXvfj4/edit9.pdf

代码:使用pdfclown 示例中的TextInfoExtractionSample.cs

输出 (用于上述文件中文本的三种不同对齐方式)

文本 [x:283,y:104,w:126,h:-23] [字体大小:-24,字体样式:ArialMT]:inverted_text

文本 [x:265,y:244,w:0,h:121] [字体大小:0,字体样式:ArialMT]:vertical_text

文本 [x:347,y:131,w:0,h:167] [字体大小:0,字体样式:ArialMT]:vertical_minus90

0 投票
1 回答
718 浏览

pdf - 无法从 pdf 中提取 cmyk 颜色空间

我正在尝试从 pdf 中提取色彩空间数据。我有一个带有 Pantone 和 CMYK 颜色空间的文件。当我使用任何 pdf 库(我使用 pdfclown、pdfbox 和 icePdf)从 PDF 中提取色彩空间时,输出数据仅包含 Pantone 色彩空间数据,甚至不包含有关 CMYK 色彩空间的单个信息。我在 CorelDraw 软件中检查了该文件,当我单击颜色空间时,它显示了确切的颜色空间值,例如(PANTONE 3735 C、C 0 M 50 Y 50 K 0 等)。如何提取 pdf (Pantone/CMYK) 中存在的所有色彩空间?

具有 CMYK 和 PANTONE 颜色的示例PDF 文档

' pdfclown ' 的输出显示 PANTONE 及其替代色彩空间:

截屏

0 投票
0 回答
163 浏览

java - PDFClown:如何克隆页面

我想在 pdfclow 的帮助下将旧 pdf 文件中的页面复制到新文件中。

到目前为止,我已经尝试了以下方法:

不幸的是,在执行clone(document)

0 投票
1 回答
181 浏览

c# - 填充大文件时出现 PDFClown System.OutOfMemoryException

我正在使用 PDFClown 使用数据库中的数据生成一个大型报告 pdf 文件。

该过程需要很长时间,并且当页面数接近 150 标记占用超过 1.5GB 的内存并出现错误时,最终会耗尽内存:

PDFClown.dll 中出现了“System.OutOfMemoryException”类型的第一次机会异常

因为我需要定期生成超过 1500 页的报告,所以这是一个主要问题。

有什么我可以做的:

  1. 不会耗尽内存(必需)
  2. 加快文件创建速度(理想情况下)

请注意:生成的报告(使用较小的数据集)是准确的,尽管文件大小相当大。

这是我的代码示例:

屏幕截图示例报告页面(出于客户隐私原因而编辑): 示例报告页面

0 投票
1 回答
355 浏览

c# - PDFClown 无法编辑创建的 PDF

我正在使用 PDF Clown(在 C# 中)生成一个 PDF 文件,其中包含单独图层上的图形(线、多边形和圆)。现在我遇到了一个问题,我已经在互联网上搜索了几天但找不到解决方案。

我有以下问题:如何确保 PDFClown 生成的 PDF 可以使用其他应用程序(例如 Blue Beam 或 Adob​​e Acrobat)进行编辑/修改?此时生成的 PDF 看起来不错,但我无法选择和修改任何图层上的任何图形(线、多边形等)。

我应该在创建图层或图形对象期间设置一些东西吗?

生成文件的链接:https ://drive.google.com/open?id=1om4UByGhfS1D9OOCYzhHrNjNQeNcJI-0

我将衷心感谢您的帮助!以下是创建折线的一段代码。

Edit2:新的测试文件 https://drive.google.com/open?id=1PHACkr2EcWrdIP5XocCnwDtakQ-P0hJY

编辑 18-01-2019 在 Bluebeam Revu 中,折线条目如下所示:

PDFClown 生成这个(在流和端流之间有二进制数据):

如何使用 PDFClown 编写 Bluebeam 输出?或者至少如何防止使用 /Filter /FlateDecode?

0 投票
1 回答
134 浏览

c# - PDFClown nuget 包无法加载程序集

我已将 PDFClown nuget 包添加到 .net 核心项目中,并在运行时遇到以下错误:

无法加载文件或程序集“PDFClown,Version=0.1.2.0,Culture=neutral,PublicKeyToken=null”或其依赖项之一。需要强命名程序集。(来自 HRESULT 的异常:0x80131044)

我还会注意到它构建没有问题,问题只出现在运行时。

0 投票
0 回答
383 浏览

c# - 将pdf转换为jpeg时出现PDFClown解析错误

在 .NET 环境中使用 PDFClown 时转换 pdf 文档时遇到问题。pdf 已成功创建(我使用 MigrDoc 进行渲染)并且可以打开它,但是当我使用此函数将其转换为 jpeg 图像时,会引发异常:

我收到以下错误:

在线 System.Drawing.Image image = renderer.Render(page, imageSize);

我试过找到几种解决方案,但没有任何效果。你对如何解决这个问题有什么建议吗?我已经直接从 nuget 安装了 PDFClown 包。