问题标签 [pdfclown]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
pdf - 如何使用.net从pdf中提取带有坐标的单词?
我正在使用带有变音符号的希伯来语 PDF。我想提取所有带有坐标的单词。我尝试使用 ITextSharp 和 pdfClown,但它们都没有给我想要的东西。
在 pdfClown 中,ITextSharp 中缺少字母\字符我没有得到单词坐标。
有没有办法做到这一点?(我正在寻找一个免费的框架\代码)
编辑:
PDF小丑代码:
java - 边缘浏览器不显示由 pdfclown 创建的 pdf 中的嵌入字体
当我使用 pdfclown 0.1.2 (java) 创建一个 pdf 文档并通过嵌入字体时
我可以在多个浏览器(即 11、ff 42、chrome 46)中很好地查看 pdf。但是当我在带有win10的新边缘浏览器中打开pdf时,文本不显示。
当我用字体系列替换字体时,即
边缘浏览器显示文本没有问题。
我错过了什么吗?
java - 使用 PDF Clown 写入 pdf 文件时如何跳过行?
使用 PDF Clown 写入 pdf 文件时如何跳过行?我在 IntelliJ 中使用它。
我将它用于将文本非常基本地写入 pdf 文件,很难想象没有关于如何跳过行的说明。
任何帮助将不胜感激。
java - 如何使用 PDFClown 将图片添加到 pdf 文件
我使用 PDFClown .jar 库将 jpeg 图像转换为 pdf 文件。但是,我收到以下错误:
java.lang.RuntimeException: java.io.EOFException
在这里你可以找到代码:
请让我知道出了什么问题?
java - 如何更改pdfclown中文本字段的颜色?
我想填写一份 PDF 表格。我正在为此使用库 Pdfclown。
我在更改 a 的颜色时遇到问题TextField
。我可以毫无问题地更改字体大小,但不能更改文本的颜色。
我将代码放在我设法在 PDF 表单中设置值的位置:
}
java - PDFClown 可编辑矩形
按照给定的示例pdfClown
,既可以突出显示特定文本,也可以在相应单词周围绘制一个矩形。
之后有没有可能使这个反应角度可以编辑Adobe Acrobat
?
我目前的工作流程(按计划):
- 导入文档
- 搜索突出显示的文档
- 确定突出显示的颜色
- 围绕矩形的外边界绘制一个矩形
- 根据确定的颜色,将标注添加到另一个包含字母的矩形
Acrobat Reader
据我所知,我不能(例如)用 . 拖动以前突出显示的单词周围的矩形。我使用 pdfClown 网页中提供的示例在每个字符周围绘制了一个反应角。
有什么我忘记考虑的吗?
java - 使用 PdfClown 打印 pdf 时,打印在没有 PdfClown 创建新页面的情况下从页面运行,如何解决?
使用 PdfClown 打印 pdf 时,打印在没有 PdfClown 创建新页面的情况下从页面运行,如何解决?
代码如下,它将文本打印到 pdf 页面上,当打印开始从页面底部运行时,应自动添加另一个 pdf 页面,是否有 PdfClown 设置可以解决这个问题?
任何帮助将不胜感激。
java - 在 Java 中从扫描的 PDF 文档中获取像素数据
我有一些文件已用 Xerox 扫描仪数字化为 PDF 文件。使用 Java,我试图从中提取 RGB 像素数据,以用于图像识别应用程序。从头开始开发这个有点超出我的水平,所以我依靠 3rd 方库进行 PDF 处理。
到目前为止,我已经尝试了 2 个不同的库;PdfBox 和 PdfClown。
使用 PdfBox,我正在尝试使用该convertToImage()
方法来获取BufferedImage
. 使用 PdfClown 我正在尝试使用类中的render(page,size)
方法Renderer
来获取BufferedImage
. 在这两种情况下,返回的图像都是空白的。所有像素均为白色 [ (r,g,b) = (255,255,255)
]。
我已经能够从其他并非源自扫描的 pdf 文档中获得非空白的 BufferedImage,因此我怀疑问题出在扫描文档的格式上。
这是一个示例 PFD 文件:http ://www.filedropper.com/innlevering1
有谁知道如何解决这个问题?或者你能提供不同的方法吗?
java - PDF小丑:创建列表
我正在寻找使用 Java 中的 PDF Clown 以编程方式创建 PDF 文件。我需要使用带有项目符号的列表。使用 PDF Clown 的当前稳定版本是否可行?如果是这样,我应该在 API 文档中查看哪个类?我在文档中搜索了列表,但是没有提到它。
在没有特定支持的情况下,我能想到的唯一方法是使用带有 X 偏移量的 BlockComposer,但这不会有项目符号点。有什么解决办法吗?
我意识到这个功能计划在 PDF Clown (0.2.0) 的下一个版本中使用,但是我等不及了。
pdf - PDFClown 中的空空格转换
我TextExtractor
在 PDFClown 中使用该类时遇到问题,出现空白空格也称为“任意换行符”。这些字符是随机嵌入的,但在 Acrobat Reader 中会被忽略。因此,存在这些字符的行将在 Acrobat 中显示为单行,但如果我'\n'
在TextExtractor.ToString(...)
.
看来 PDF 小丑只是简单地接受任何空白字符并将其转换为单个空格,或' '
. 有没有办法绕过这种转换,而是提取原始字符?