问题标签 [pdfclown]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
79 浏览

java - ClassNotFoundException org.odfclown.files.File

我正在使用 Maven 和 Spring MVC 创建一个 webapp。使用 Maven 构建时会出现以下错误:

在我的构建路径中,我已经导入了 pdfclow.jars。是否可能因为我在 WebAppInitializer 中使用“标准”SpringDispatcher 而发生此错误?

0 投票
0 回答
63 浏览

java - 使用 pdfclown 获取文档的矩形

我正在使用 PDFClown 来分析 PDF 文档。一些文档的页面带有矩形,例如:在此处输入图像描述

pdfclow 是否提供处理这些矩形的功能?例如到达那里的坐标、长度和宽度?

0 投票
0 回答
154 浏览

c# - PDFClown 提取表格 如何使用 PDFClown 从 PDF 中提取表格

如何使用 PDFClown 从 PDF 中提取表格。

我想获取表数据并将其保存到数据库。

我愿意使用不同的框架/包,只要它是免费的

谢谢

0 投票
1 回答
350 浏览

c# - PDFClown Find and replace page

Using pdfclown,

I was wondering the best practice to find a page in a Existing PDF doc, and replace with a page from another PDF doc.

I have the bookmark and pagelabel of both pages.

0 投票
1 回答
559 浏览

java - pdf小丑-不突出显示特定的搜索关键字

我正在使用带有 pdfclown-0.2.0-HEAD.jar 的 pdf-clown。我编写了下面的代码以突出显示在中文 pdf 文件中搜索关键字,并且相同的代码适用于英文 pdf 文件。

请找到输出图像的附件

请提供您的输入以突出显示非英语 pdf 文件的特定搜索关键字。

我在下面的中文文本中搜索关键字。

普双双套政体采用绕制套车开宪法装班要走修

在此处输入图像描述

0 投票
1 回答
214 浏览

pdf - 使用 PDF Clown 的 PDF 写入错误

我有一个 PDF 文件,我正在使用 PDF Clown 阅读该文件,然后为其添加一些注释。之后,我尝试使用 org.pdfclown.files.File 的 Save 方法将文件序列化到磁盘。这样做我得到以下错误

运行示例时发生异常:org.pdfclown.util.parsers.PostScriptParseException: Unknown type beginning: 'False' at org.pdfclown.tokens.BaseParser.ParsePdfObject() in d:\eProof\testProjects\pdf_clown_svn\dotNET\pdfclow .lib\src\org\pdfclown\tokens\BaseParser.cs:第 149 行,位于 d:\eProof\testProjects\pdf_clown_svn\dotNET\pdfclown.lib\src\org\pdfclown 中的 org.pdfclown.tokens.FileParser.ParsePdfObject() \tokens\FileParser.cs:第 150 行,位于 d:\eProof\testProjects\pdf_clown_svn\dotNET\pdfclown.lib\src\org\pdfclown\tokens\FileParser.cs 中的 org.pdfclown.tokens.FileParser.ParsePdfObject(XRefEntry xrefEntry) : d:\eProof\testProjects\pdf_clown_svn\dotNET\pdfclown.lib\src\org\pdfclown\objects\PdfIndirectObject.cs 中 org.pdfclown.objects.PdfIndirectObject.get_DataObject() 的第 221 行:org.pdfclown 的第 275 行。对象。PdfIndirectObject.WriteTo(IOutputStream stream, File context) in d:\eProof\testProjects\pdf_clown_svn\dotNET\pdfclow.lib\src\org\pdfclown\objects\PdfIndirectObject.cs: org.pdfclown.tokens.PlainWriter.WriteStandard 的第 248 行() 在 d:\eProof\testProjects\pdf_clown_svn\dotNET\pdfclown.lib\src\org\pdfclown\tokens\PlainWriter.cs:line 205 at org.pdfclown.tokens.Writer.Write(SerializationModeEnum 模式) 在 d:\ eProof\testProjects\pdf_clown_svn\dotNET\pdfclown.lib\src\org\pdfclown\tokens\Writer.cs: d:\eProof\testProjects 中 org.pdfclown.files.File.Save(IOutputStream 流,SerializationModeEnum 模式)的第 132 行\pdf_clown_svn\dotNET\pdfclown.lib\src\org\pdfclown\files\File.cs: d:\eProof\testProjects\pdf_clown_svn\ 中 org.pdfclown.files.File.Save(字符串路径,SerializationModeEnum 模式)的第 315 行dotNET\pdf 小丑。lib\src\org\pdfclown\files\File.cs: org.pdfclown.samples.cli.HelloWorldSample.UzairTestFunc() 中的第 272 行,位于 d:\eProof\testProjects\pdf_clown_svn\dotNET\pdfclown.samples.cli\src\ org\pdfclown\samples\cli\HelloWorldSample.cs:第 40 行,位于 d:\eProof\testProjects\pdf_clown_svn\dotNET\pdfclown.samples.cli\src\org\ 中的 org.pdfclown.samples.cli.HelloWorldSample.Run() pdfclown\samples\cli\HelloWorldSample.cs:第 20 行,位于 org.pdfclown.samples.cli.SampleLoader.Run(String inputPath, String outputPath) in d:\eProof\testProjects\pdf_clown_svn\dotNET\pdfclown.samples.cli\src \org\pdfclown\samples\cli\SampleLoader.cs:第 123 行samples.cli.HelloWorldSample.Run() 在 d:\eProof\testProjects\pdf_clown_svn\dotNET\pdfclown.samples.cli\src\org\pdfclown\samples\cli\HelloWorldSample.cs: org.pdfclown.samples 中的第 20 行。 cli.SampleLoader.Run(String inputPath, String outputPath) in d:\eProof\testProjects\pdf_clown_svn\dotNET\pdfclown.samples.cli\src\org\pdfclown\samples\cli\SampleLoader.cs:line 123samples.cli.HelloWorldSample.Run() 在 d:\eProof\testProjects\pdf_clown_svn\dotNET\pdfclown.samples.cli\src\org\pdfclown\samples\cli\HelloWorldSample.cs: org.pdfclown.samples 中的第 20 行。 cli.SampleLoader.Run(String inputPath, String outputPath) in d:\eProof\testProjects\pdf_clown_svn\dotNET\pdfclown.samples.cli\src\org\pdfclown\samples\cli\SampleLoader.cs:line 123

现在我无法在此处共享 PDF,但我看到它无法处理 PDF 中的以下对象
...
96 0 obj
False
endobj
...

任何想法如何在 PDF Clown 中解决这个问题?

0 投票
1 回答
41 浏览

java - 如何在pdfclown中将非英语搜索关键字的颜色突出显示为橙色

我正在使用 pdf 小丑,我得到了像将非英语搜索关键字的颜色突出显示为橙色的要求。目前我可以根据屏幕截图搜索关键字并用黄色突出显示非英语关键字: 截屏

请提供您的输入以将非英语搜索关键字的颜色突出显示为橙色。在此先感谢。

0 投票
1 回答
94 浏览

java - 如何使用 pdfclown 提高文件中突出显示的搜索关键字的性能

我正在使用 pdfclown,下面的代码大约需要 100 秒来突出显示同一文件中的搜索关键字。请在下面的代码中提供您的输入以提高性能。请在下面的 url 中找到 jar 路径以运行此代码。 https://drive.google.com/drive/folders/1nW8bk6bcAG6g7LZYy2YAAMk46hI9IPUh

0 投票
1 回答
140 浏览

java - 使用 pdfclown 几个搜索关键字在中文/日文文档中没有突出显示

我面临一些搜索关键字在中文文档中没有突出显示的问题。由于机密问题,我没有提供实际的 pdf。搜索关键字是1亿)路径或2)收入来源请找到我测试过的pdf文件,pdf路径链接。和实际结果链接。我已经在下面的链接中发布了与此问题相关的内容,但一些关键字在少数中文文档中没有正确突出显示。请提供您的输入以突出显示我提到的搜索关键字。

0 投票
1 回答
321 浏览

java - 如何解决 org.pdfclown.util.NotImplementedException

当我加载一个中文文档而不是所有中文文档时,我遇到了异常。我的需求文档不是编码格式,它看起来像普通/纯中文文档。根据机密问题,我没有提供我的需求文档。请提供您的支持所有中文pdf文档的输入。