问题标签 [jbig2]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
317 浏览

pdf - 嵌入式 JBIG2 Postscript 流未在 PDF 中呈现

我正在学习手写Postscript。我从下面的链接中获取了一个 JBIG2 图像(此处的示例中使用了 amb_1.jb2:http://jbig2dec.sourceforge.net/ubc/main.html ,并将其添加到一个流中PDF 文件。

有问题的PDF在这里。 https://gist.github.com/brandonprry/277cbbc581be4e8eaa403a16403a6996

在我尝试过的任何 PDF 阅读器中打开它都没有错误,但图像没有呈现。

渲染嵌入式 JBIG2 图像流(9 0 obj)时我缺少什么?使用 MuPDF 工具“mutool info”,它识别出 PDF 包含 JBIG2 图像流,但据我所知,它仍然没有呈现它。

我注意到这个堆栈溢出帖子指出不应该包含魔术头,我目前在上面的示例中。

pdf 中的 jbig2 数据不是有效的 jbig2 数据。错误的魔法

无论 JBIG2 流中是否有 8 字节标头,都不会打印错误,也不会呈现图像。

任何想法都非常感谢。

0 投票
1 回答
520 浏览

java - 提供者 com.levigo.jbig2.util.log.JDKLoggerBridge 不是子类型

使用以下代码将 PDF 文件写入 HTML 文件格式时...

build.gradle文件具有以下依赖项列表...

哦,快!从 JDK 收到以下消息...

在搜索了有关此错误的更多信息后,没有任何线索。如果有人对此有任何想法,请对此提出一些建议。

谢谢

0 投票
1 回答
906 浏览

c# - 使用带有 /JBIG2 过滤器的 PDFSharp 从 pdf 中提取图像

我正在尝试使用 PDFsharp 从 PDF 文件中提取图像。我运行代码的测试文件显示过滤器类型为 /JBIG2。如果可以使用 PDFSharp,我希望帮助了解如何解码并保存此图像。

我用来提取图像然后保存的代码如下:

在上面,我得到的过滤器类型为/JBIG2,我确实支持。上面的代码来自PDFSharp: Export Images Sample

0 投票
1 回答
146 浏览

ghostscript - 让 ghostscript 单独留下 JBIG2 文件

我正在使用gs从 PDF 中删除一些糟糕的 OCR,这些 OCR 本质上是带有不可见文本层的书页图像。其中一些页面图像被编码为 JBIG2。当我通过 gs 运行它们时,它会将图像格式更改为 CCIT,这通常还不错,但可以比 JBIG2 版本大 10 到 20 倍。

我一直在寻找一种方法,要么让 gs 不理会它们——比如 PassThroughJPEGImages——要么用 MonoImageEncoder 重新编码它们,但我没有成功。我没有找到任何类似的直通选项,并且在将编码器设置为 JBIG2Encode 时出错。我假设我发现后者不是标准选项,但需要 Luratech 库。

任何人都可以确认或 - 最好 - 解释我的错误吗?

TIA。

0 投票
1 回答
172 浏览

c# - C# PDF 压缩/将 JBIG2 重新压缩为 JPEG

我用 JBIG2 压缩了 PDF。如何将其重新压缩为 JPEG 或任何其他压缩算法?我想使用 Itextsharp/PDFSharp 之类的开源解决方案或任何其他 c# .net 开源项目。

0 投票
1 回答
717 浏览

python - 从PDF中提取图像,如何处理JBIG2编码

我有一堆 PDF 文件,其中一些是纯文本,但有些完全或部分保存为“每页一个图像”,因为它们是从扫描仪生成的。

我需要提取PDF 中包含的所有图像,然后分别检查每个图像。

我能够使用在 SO 中找到的 python 脚本提取大部分图像,请参见问题:

在python中从PDF中提取图像而不重新采样?

一些包含的图像是使用 JBIG2 编码的,我找不到任何 python 或其他工具来将 jbig2 转换为可以用通用图形工具轻松打开的东西。

0 投票
2 回答
1485 浏览

java - pdfbox 应用程序 fat jar 给出“无法读取 JBIG2 图像:未安装 jbig2-imageio”,但可以从 IDE 运行

我在构建使用 pdfbox 的应用程序时遇到问题。当我从 IDE 运行该应用程序时(我使用 netbeans 8.1),该应用程序能够阅读带有 jbig2 图像的书籍(我在 pom.xml 中有 jbig2 的 maven 依赖项)。问题是当我构建应用程序时创建了一个胖罐。当我使用相同的输入 pdf 运行 fat jar 时,会出现以下错误:

评论该错误的线程似乎没有解决我的问题(他们说必须将 maven 依赖项添加到 pom,但该依赖项已经在我的 pom 上)。

我还检查了 jbig2 库类是否在 fat jar 中,所以我不知道发生了什么。

我已经在一个看起来像这样的小应用程序中隔离了这个问题:

我将整个孤立的示例项目放在这里(目的是帮助解决问题): http ://www.frojasg1.com/20200504.PdfImageExtractor.zip

当我从 IDE 运行该应用程序时,它会产生以下输出:

当我从命令行运行应用程序时,它会给出以下输出:

有人知道为什么胖罐子无法读取 jbig2 图像吗?

0 投票
1 回答
610 浏览

java - PDFBox 渲染 Jpeg2000 和 JBIG2

我想将每个 pdf 页面转换为图像(如屏幕截图),然后将该图像上传到存储服务。

我确实jbig2-imageio通过将此片段添加到 pom.xml 来导入

但生成的图像仍然是空白的。并记录此错误:Cannot read JPEG2000 image: Java Advanced Imaging (JAI) Image I/O Tools are not installed

那么,我错过了什么?,我认为添加依赖项可以解决该错误。

我应该使用 pdfbox-tools.imageIo 而不是 java.imageio

PS:我是Java新手,所以我可能是配置问题??

0 投票
1 回答
98 浏览

java - JBig2 在运行时没有解决?

我有一个 Java/Gradle 应用程序,它使用 PDFBox 将 PDF 转换为 PNG。在我的 IDE 上进行本地测试时,我的代码如下:

在 prod 中,另一个应用程序启动了一个运行我的应用程序的新 JVM。我不确定父应用程序的类路径是什么,但如果我的 Gradle 依赖项中有以下内容,这有关系吗?

在我的 IDE 上本地测试我的主要方法时,它工作正常,但没有使用我描述的第二个设置。我还检查了我的清单,可以看到以下文件:

我错过了什么?

0 投票
1 回答
130 浏览

java - 如果 PDF 文件包含 JBIG2 图像,如何在 Java 中查找?

我正在使用 Apache PDFBox 读取 PDF 文件并将其转换为 JPEG 图像。

有时 PDF 文档包含 JBIG2 图像。我正在使用 PDFBox 的JBIG2 ImageIO 插件来正确处理此类 PDF 文档。这工作正常。但我想知道转换后的原始 PDF 文档是否包含 JBIG2 图像。

我检查了PDDocument Javadoc,但我想不出办法来回答这个看似简单的问题:给定的 PDF 文档是否至少包含一个 JBIG2 图像?

由于我已经在使用 PDFBox,因此首选使用 PDFBox 的解决方案,但其他建议也将受到高度赞赏。