问题标签 [image-extraction]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1740 浏览

python-3.x - 用 pymupdf 以正确的顺序提取 pdf 的图像

我目前正在为 pdf 文件开发 Python 3.x 图像提取器,但似乎无法找到解决我在整个工作过程中遇到的问题的解决方案。我的目的是提取 pdf 文件(车辆报告)的所有图像,而无需提供这些文件的公司的徽标。到目前为止,我有一个使用 fitz 的工作代码,它可以找到图像并存储它们(我在互联网上找到了这个代码)。不幸的是,它们以错误的顺序退回。为了用标题注释图片,它们必须按照它们在 pdf 中的显示顺序保存。

我已经尝试通过按升序使用外部参照字符串(在 pdf 中定义对象的字符串)中定义的对象名称来解决这个问题。在那个版本之前,我通过字典用计数器注释图片(我知道它是未排序的,但通过对键进行排序来修复它),但是大约 30 张图像中有大约 2-4 张未排序。此外,这段代码对我来说似乎不是一个好的解决方案,因为我通过注释计数器来“伪造”图像编号。

我当前的版本(外部参照名称):

也可以随意提出一种全新的方式来完成这项任务。在此先感谢您的帮助。

0 投票
2 回答
186 浏览

python - python提取日期

我需要从 jpeg 格式中提取日期,我已经以字符串的形式从 jpeg 中提取了文本并使用正则表达式来提取日期,

来自 JPEG 的文本

续:7225811153;BillNo4896TableNoR306 07-Jun-201921:18:40

使用的代码

导入正则表达式和日期时间

正则表达式来识别上述字符串中的日期

输出 re.Match 对象;跨度=(89, 100),匹配='07-Jun-2019'

但是在执行上述代码后,我尝试了以下方法来提取日期

代码

提取日期

输出

ValueError:时间数据 '07-Jun-2019' 与格式 '%d-%B-%Y' 不匹配

我哪里错了,或者有没有更好的方法来做同样的事情。非常感谢您的帮助

0 投票
1 回答
91 浏览

ruby-on-rails - 如何使用 Ruby 中的路径裁剪图像?

这是路径“M276,189h268c5.5,0,10,4.5,10,10v196c0,5.5-4.5,10-10,10H276 c-5.5,0-10-4.5-10-10V199C266,193.5,270.5,189,276,189z "

这是输入图像:

输入图像

使用以下代码将路径应用于图像后

这是输出图像:

输出图像

现在我想剪切图像的红色部分。这意味着期望棕色部分仅可见。我使用了正常的图像级裁剪方法。有了这个我只能提取红色部分但我想从输出图像中提取红色以外的图像。

这是黑色图像的 样本输出黑色的样本输出

也许我们必须反向剪辑或反向裁剪才能得到这个......

0 投票
1 回答
669 浏览

java - PDFBox:ExtractImages JPEG2000 图像未提取

我正在尝试使用 PDFBox 提取 PDF 文件中的所有图像。它适用于包含 jpeg 和 png 图像的 pdf。但它不适用于 OpenJPEG2000 图像。我收到以下异常:收到以下错误:

在所有版本的 PDFBox 中,都会出现同样的异常。也尝试使用独立的 jar。

我也在 pom.xml 中包含了必要的依赖项。

任何帮助将不胜感激。

0 投票
1 回答
622 浏览

python - Python从pdf中提取图像序列

我试图使用 PyMuPDF (fitz) 从 pdf 中提取图像。我的 pdf 在一个页面中有多个图像。我在保存图像时保持正确的序列号。我看到被提取的图像没有遵循正确的顺序。有时它从底部开始提取,有时从顶部开始等等。有没有办法修改我的代码,以便提取遵循正确的顺序?下面给出的是我正在使用的代码:

下面给出的是pdf的示例页面

从 pdf 中截取的快照

0 投票
1 回答
134 浏览

ffmpeg - FFMPEG 可能的最佳质量图像提取

我想从视频中提取图片(png)以进行 3D 建模任务。他们应该是最好的质量。视频为:1920x1080、60 fps、24 位深度、mp4 .. 我现在尝试了不同的方法,觉得我应该采用: ffmpeg -i input.mp4 -vf "select=eq(pict_type\,I)" -vsync vfr thumb%04d.png -hide_banner 但我不确定我是否可以得到更高的质量。放大将非常重要。感谢您的每一个帮助。

0 投票
2 回答
19 浏览

image-extraction - 从以位置 (x,y) 为中心的输入图像中提取 3×3 图像片段

我想问如何从以位置(x,y)为中心的输入图像中提取an×n图像片段,图像的格式如下[[num,num,num],[num,numm,num], [num,num,num]........],图片大小约为 10 * 10。谢谢!

0 投票
0 回答
32 浏览

opencv - Multiple Road Surfaces Segmentation/Extraction

I have been researching about road surface segmentation. Some things that I noticed:

  1. Most of road segmentation research that has been done applies the segmentation on either front-view perspective images (autonomous cars) or top-down perspective satellite images
  2. They fail to detect more than one separate roads if there are multiple roads in an image

I am trying to extract every road surface area from a traffic scene. For example traffic scenes like this:

ORI

And expecting this kind of result:

Result

(image source)

I have tried various autonomous vehicle road segmentation model and they always fail to detect multiple roads in the scene. Sometimes, they also fail to detect anything because I suppose the models are trained with front-view perspective scenes only. I have not tried the top-down satellite perspective model, but I reckon it will also give bad result because of perspective difference.

My question is, is there any code reference or research about multiple road extraction from traffic scenes? Or even, is it even possible at all with images from this perspective? The image source refer to a paper that does exactly what I want, but the explanation of their approach still eludes me. I'm not sure if the process involves deep learning or manual segmentation process.

Thank you.

0 投票
1 回答
29 浏览

python - 浏览pdf文件以查找特定页面并使用python从图像中提取表格数据

我遇到了一项任务,该任务要求我从 pdf 文件中的图像中提取表格数据,以通过 python 代码整齐地格式化数据帧。有几个文件要处理,所有文件中的相关页面可能有不同的页码,因此这个问题的步骤顺序(我的假设)是:

  1. 导航到 pdf 的相关部分
  2. 提取表格数据的图像
  3. 从图像中提取数据,格式化并转换为数据帧。

一些谷歌搜索导致我找到了用于 pdf 文本提取、表格提取等的库 - 仅限模块化解决方案。

我将不胜感激在这方面的一些帮助。我应该使用哪些软件包?我的方法正确吗?对于类似问题,我可以获得任何有用的代码片段的参考吗?

所需表的页面结构