问题标签 [pymupdf]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

140 问题

0 投票

0 回答

268 浏览

python - python中PDF中的额外svg和文本

我需要在 python 中将文本和 svgs 合并到 pdf 中。我试过 PyDF2，PyPDF4，tika 没用。我尝试使用 pymupdf 但出现以下错误。有人可以帮我吗。我正在使用 python 3.8，pycharm。pymupdf 所需的所有模块都已经存在。

错误：

2021-06-03T14:22:12.393

0 投票

1 回答

181 浏览

python - 如何避免在 python 中从 PDF 文件中提取小图像元素？

我正在尝试从此 PDF 文件中提取所有图像：https ://s3.us-west-2.amazonaws.com/secure.notion-static.com/566ca0ca-393d-47d4-b3fc-eb3632777bf8/example.pdf ?X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=AKIAT73L2G45O3KS52Y5%2F20210610%2Fus-west-2%2Fs3%2Faws4_request&X-Amz-Date=20210610T041944Z&X-Amz-Expires=86400&X-Amz-Signature=2f8a2d08647e4953448f890adb56d11b1d01e21b941ca3dc9f9b5ab3caa7f018&X-Amz -SignedHeaders=host&response-content-disposition=文件名%20%3D%22example.pdf%22

使用 fitz（PyMuPDF 模块）使用以下代码提取所有图像，以及小图标。我必须避免提取这些图标并仅获取图像。

python extract pymupdf

2021-06-10T05:29:12.833

0 投票

0 回答

75 浏览

python - pyqt多线程：为什么工作线程阻塞主线程

当我尝试加载一些size>10MB 或pages>300 的 .pdf 时，

worker线程会阻塞主线程，不知道怎么QThread正确使用，

我希望每次pixmap_page_load运行时，信号都会发送到主线程。

这是最少的代码，需要模块pymupdf和pdf文件

python pyqt pymupdf

2021-06-15T12:54:48.713

0 投票

0 回答

33 浏览

python - 在 pymupdf 中，annot.rect 值是在创建还是保存时？

pymupdf 用户的快速问题。

我创建了一个基于 pymupdf 的工具，用于标记 .pdf 试卷。用户对 .pdf 文件应用一个勾形注释框。此过程的一部分是删除 DataFrame 中的重复注释。这是为了确保删除任何在空间上巧合的“复制和粘贴”。

我有一个用户系统地在通过眼睛或 pymupdf 脚本计数时返回的论文上有不同数量的滴答声。我可以从annot.rect返回的列表中看到确实存在重复项，这些重复项随后将在 DataFrame 中删除。但是，在这种情况下，对于这个用户，很明显没有注释重叠。

那么，pymupdf 是否返回注释创建点或保存位置的坐标。我有相互矛盾的证据……任何见解都会有很大帮助。

干杯，戴夫

python pymupdf

2021-06-17T16:24:39.180

0 投票

0 回答

146 浏览

python - 使用 PyMuPDF 进行图像替换

我正在使用 PyMuPDF 替换图像。但是当我有一个映射到它们的 bbox 坐标的图像字典时，只有第一页中的图像被替换。如何让字典中的所有图像都被替换？这是我的代码：'bbval' 是这样的字典： bbval dictionary

python image image-processing pymupdf

2021-06-21T08:20:35.273

0 投票

1 回答

148 浏览

python - 如何在 PyQt5 中使用 pymupdf 读取 pdf 文件？

我想通过 pilihfile 按钮打开 pdf 文件，然后将其名称显示在 textEdit 上，并使用 pymupdf 在 textEdit_2 上显示其 pdf 内容。但我收到错误说无法打开（'D:/Kuliah/KRIP.pdf', 'PDF Files (*.pdf)'）：参数无效。我不知道如何解决它。

python pyqt pyqt5 pymupdf

2021-06-22T09:39:43.727

0 投票

1 回答

223 浏览