问题标签 [pymupdf]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
85 浏览

python - 晚上空闲时,我的 Flask 应用程序收到奇怪的请求

我已经让我的flask\flask-login应用程序在一夜之间在我的 PC 上运行。早上,日志突然爆出以下内容:

在此处输入图像描述

当然,我的服务器上没有这样的 URL。前一天,我试图安装一些软件包: PyMuPDFfitz以及他们需要的一百多个:

然后它在构建一个名为的东西时失败了traits

我是否面临一些不安全的库试图扫描我的端点并窃取数据?

在我看来,它也在暴力破解我的登录端点:

在此处输入图像描述

会是什么呢?作为一个蟒蛇新手,我既好奇又害怕。

UPD,首先,我在责备etelemetry

0 投票
1 回答
308 浏览

python - 如何根据 QScrollArea 内的子内容自动调整 QVBoxLayout 的大小?

最近,我正在尝试使用 PyQT5 制作 PDF 查看器。我修改了这篇文章中提供的代码(图像查看器 GUI 无法正确映射鼠标按下事件的坐标)。我创建了一个包含 QVBoxLayout 的 QScrollArea,以便将多个 QLables 动态添加到滚动区域中。然后我会将 PDF 页面作为 QImage (pixmap) 加载到每个单独的 QLabel 中。我已成功加载并显示 QLabels 中的 PDF 页面。但是,我遇到了一个问题。PDF 页面图像的垂直布局中的 QLabel 无法展开以显示整个页面(根据 QImage pixmap 的大小)。所以使用这种方式的结果只会显示页面的一小部分。我也无法向下滚动所有页面。我希望 PDF 页面可以加载到 QLabels 中,并根据内容很好地展开。然后,Qlabels 可以在布局中垂直分组。布局可以根据 QLable 自动扩展和调整大小。最后,我可以向下滚动 scrollArea 以阅读所有 PDF 页面。

另外,如何在每个 QLabel 中捕获鼠标位置?最终,我想让用户单击页面上的特定位置以在该位置添加文本。在我从 QLabel 和特定页码中获得坐标后,我会将信息传递给 PyMuPDF 以将文本写入 textBox 并导出 PDF 文件。

到目前为止,这是我的代码:

0 投票
2 回答
1556 浏览

python - Python PyMuPDF / Fitz 从 extractImage 旋转图像

我正在使用 PyMuPDF / Fitz 从 pdf 页面中提取嵌入的图像。这很好用,但有些 pdf 文件,但对于某些文件,图像旋转了 90 度。我看不到任何可用于纠正此问题的条件。有没有人经历过这个?有人有解决方案吗?

我总是很感激帮助!

0 投票
2 回答
3340 浏览

python - 如何使用python中的fitz模块更改pdf中的突出显示颜色

嗨,我正在尝试更改 pdf 中的突出显示颜色,但无法这样做。默认突出显示颜色为黄色,但我想更改它以下是我的代码:

另外,我如何一起搜索整个 pdf 而不仅仅是一页

以及如何突出显示pdf中给出的图像上的文本

0 投票
1 回答
397 浏览

python - 使用 PyMuPDF 从 PDF 中提取完整的超链接字符串

我正在尝试从 PDF 中提取每个链接。我可以使用以下代码获取每个超链接:

问题如下。如果超链接有多个单词,我将无法获取第二个单词,因为我使用的是 page.getLinks() 中的矩形,并且此方法只能找到超链接的第一个单词。

例如,下面的超链接: 点击我!

我的代码只能获取 ''Click'' 字符串。

我能做些什么来解决这个问题?我被困住了,我什么都想不起来。此外,如果您有其他不使用 PyMuPDF 的解决方案,欢迎使用!

0 投票
2 回答
2591 浏览

python-3.x - PyMuPDF 在底部插入图像

我正在尝试阅读 PDF 并在 PDF 中每一页的底部(页脚)插入图像。我试过 PyMuPDF 库。

问题:无论Rect我给出什么(高度、宽度),它都不会出现在底部,图像只会出现在页面的上半部分(PDF 页面)。

我的代码:

页面中间带有页脚图像的已处理图像: https ://i.stack.imgur.com/HK9mm.png

页脚图片: https ://i.stack.imgur.com/FRQYE.jpg

请帮忙!

请让我知道这是否可以通过使用任何其他库来实现。

0 投票
0 回答
389 浏览

python-3.x - 如何正确地将 alpha 通道添加到使用 PyMuPDF 从 PDF 中提取的图像中

我正在尝试使用 PyMuPDF 和这个食谱从 PDF 中提取图像。对于某些具有硬边缘透明度的图像,它可以工作。但是对于具有哑光透明度的图像,我会沿着边缘得到伪影。

当我将没有 alpha 信息的图像和 alpha 掩码提取为单独的 PNG 并使用 GIMP 将它们组合时,结果符合预期,因此信息似乎就在那里。

任何人都可以帮忙吗?我错过了一步吗?

0 投票
1 回答
919 浏览

pdf - 使用 PyMuPDF 将 PDF 页面 Pixmap 保存为 PNG 时出现颜色问题

我正在运行 PyMuPDF 1.16.17 文档中的以下 Python 代码,它为 PDF 文件中的每一页保存 PNG 图像。

生成的 PNG 图像的颜色与 PDF 原件不同(太饱和且对比度太高)。我知道函数Page.getPixmap()有一个“颜色空间”参数,并且使用Document.getPageImageList我发现我的 PDF 的颜色空间是“DeviceCMYK”。但是,当我尝试使用 CMYK 作为颜色空间获取 Pixmap 时(用或 `pix = page.getPixmap(colorspace=csCMYK) 替换pix = page.getPixmap()pix = page.getPixmap(colorspace="CMYK")),它不会改变结果颜色。任何帮助表示赞赏。

0 投票
1 回答
291 浏览

python - 如何使用 Python 选择 PDF 中搜索文本的值?

PDF 包含以下信息:

使用 PyMUPDF 我可以在 PDF 中搜索一个单词并突出显示它,但我想突出显示搜索文本的右侧值。
在此示例中,我想突出显示名称的值,即 ABC。因为对于不同的文件,名称值可能会从 ABC 更改为 PQR。

任何人都可以帮助如何做到这一点?非常感谢!

0 投票
2 回答
219 浏览

python-3.x - 在 PDF 中查找字符串并使用 Python 突出显示它们

我正在尝试在 PDF 中搜索字符串并突出显示它们并使用 Python 保存它。数据文件是一个 excel 表(第 2 列),并且还包含特殊字符。我尝试为此使用 PyMuPDF lib,但它给出了以下错误:“ 在此处输入图像描述

下面是使用的代码: