问题标签 [pdfclown]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
pdfclown - 如何确定文本是否适合框架?
我有一个框架并使用 BlockComposer 将多行文本写入框架。行的文本由用户输入决定,所以我事先不知道它们将包含多少个字符。
我怎么知道所有的线条是否都适合框架,或者它们是否会溢出框架的高度?
下面的例子是用 Scala 编写的,它使用 pdfclown java:
c# - 使用 PDFClown (.net 版本) 列出嵌入的字体
有没有办法使用 PDFClown 库获取 PDF 文件中的嵌入字体列表?目的是检查它是否不是扫描的 PDF,如果它没有嵌入字体,则假设它是扫描的文档。
提前致谢
c# - 使用 PDFClown 将文本转换为 PDF
请告诉我如何使用 PDF Clown 库将文本转换为 PDF。我第一次使用 pdflown 库。有没有办法使用这个库将我的字符串绑定到 PDF。
c# - PDF Clown 不呈现文本
我使用PDF Clown创建包含文本和不同形状的 PDF 文件。保存文件会带来所需的结果。但是当我打印页面或将它们渲染为位图时,只有形状可见并且缺少文本元素。
我已经用多个文件尝试了不同版本的库,总是得到相同的结果。
也许有人可以就这个问题给我一个提示。
编辑:
这是我使用的源代码的简化形式(结果与上述相同;见最后的图片):
上述代码的结果(打印版本是用虚拟打印机Adobe PDF创建的;也用XPS Document Writer测试过):
pdfclown - 如何使用 PDFClown 从 PDF 文件中删除对象
我有一个包含很多不可见路径的 pdf。由于路径的数量稍后会产生问题,因此我想删除具有白色的路径。
到目前为止,我正在尝试使用ContentScanner
:
它可以正确识别路径,但最终这些路径并未从 PDF 中删除。这里是处理 PDF 的代码(它只从源 pdf 中提取一页):
保存的 PDF 文件仍然包含我试图删除的路径。最后如何从 PDF 中删除对象?
谢谢,托马斯
c# - PDFClown .NET 打开 Windows 资源管理器而不是指定路径
目前我有这个测试代码
如何打开一般 Windows 资源管理器另存为提示而不是保存到硬代码路径“test.pdf”?(在file.save()
)
谢谢
pdfbox - 想将pdf页面的内容添加到另一个pdf
我有两个数据有限的 pdf,即单页。我想将一个 pdf 的数据合并到另一个 pdf 但在单个页面上(它不应该创建另一个页面来附加外部数据)。有没有办法使用 pdfbox 或 pdfclown 做到这一点?
java - PDFClown 一行不同的字体大小
我正在使用 PDFClown 来分析 PDF 文档。在许多文档中,PDFClown 中的某些字符似乎具有不同的高度,即使它们显然具有相同的高度。有解决方法吗?
这是代码:
这是一个示例 PDFDocument:
在本文档中,我标记了两个文本块,它们都包含“百万”一词。在分析“百万”中每个字符的大小时,会发生以下情况:
- 第一个标记中的“m”具有高度:14,50 和宽度:8,5
- 第一个标记中的“i”具有高度:14,50 和宽度:3,0
- 第一个标记中的“l”具有高度:14,50 和宽度 3,0
- 第二个标记中的“m”具有高度:10,56 和宽度:6,255
- 第二个标记中的“i”具有高度:10,56 和宽度:2,23
- 第二个标记中的“l”具有高度:10,56 和宽度:2,23
即使两个文本块的所有字符显然具有相同的大小 pdf 小丑说大小是不同的。
java - PDF Clown Highlight Multiple search word is failed for PDF contains images, color text, Complex Diagrams
我正在使用 PDFClown 突出显示 PDF 文档中的多个搜索词。在许多包含彩色图像、复杂图表、彩色文本的 pdf 文档中,PDFClown 会在那里抛出异常并且无法突出显示匹配的单词。提到的代码适用于普通或简单的 Pdf。
这是我用于测试的 PDF https://drive.google.com/file/d/0B-nuOO6Zsa4rXy1DS2JjX1RnYmM/view?usp=sharing
这是堆栈跟踪
java - PDFClown:创建 TextMarkup 会导致 TextMarkup 的框不准确
我正在使用 PDFClown 来分析和使用 PDFDocuments。我的目标是突出显示表格中的所有数字。对于属于一起的所有数字(例如:表格一列中的所有数字),我将创建一个带有四边形列表的 TextMarkup。首先,看起来everythink 运行良好:左侧的所有高亮属于一个TextMarkup,右侧的所有高亮属于另一个TextMarkup。
但是在分析 TextMarkup 的大小时,大小比它看到的图片要大。因此,当在左侧 TextMarkup 框周围绘制一个矩形时,尽管左侧 TextMarkup 没有突出显示与另一列相交,但该矩形与另一列相交。有没有办法优化 TextMarkup 的 Box?我认为盒子有一个球根状的结尾,所以盒子与另一个 TextMarkup 相交
这是创建 TextMarkup 的代码:
这是一个示例文件示例
谢谢你 !!