问题标签 [image-extraction]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
261 浏览

php - PHP 版本和 exif_imagetype() 函数

大于exif_imagetype()不支持函数吗?PHP Versions5.0

0 投票
0 回答
1673 浏览

java - 使用 iText 从 PDF 中获取可见签名?

是否可以使用 itext 提取已签名 PDF 的可见签名(捕获图像)?

工作流程:

  1. 列出文件的所有签名
  2. 带有签名的显示包括可见的签名
  3. 显示哪些是有效的
  4. 提取签名图像(需要为每个签名提取正确的图像)

1+3:

2:将用 4 解决

4:这里开始麻烦了。如何获得指向正确字段(注释)的链接以及如何将嵌入的数据呈现为图像(如果需要,也可以使用外部图像库实现)。

我已经找到了如何获取Item,但不是 Image Stream 或 PdfSignatureAppearance的链接:

谢谢你的帮助。问候。

0 投票
1 回答
3163 浏览

pdf - How to batch extract images from a PDF

TL/DR Version:
How do I extract the image out of the Type B file below. Note that there are around 600 such files so I would prefer some sort of batch operation.

Type A
Type B

Details:
I'm redesigning my company's online catalog an need top extract the design images from ~2000 PDFs which either Type A (where I can export the images using Acrobat XI Tools - Document Processing - Extract All Images) or of Type B.

I don't know how these were designed or the cause for the difference (the PDF creation was contracted out to some now defunct company 2 yrs ago).

As noted above I can batch process (Acrobat XI Action Wizard) all Type A files but that still leaves me with ~600 Type B files for which I am clueless.

Any ideas?

0 投票
3 回答
163 浏览

java - Java:检查图像是否移动

我想在图像中的某个位置查看所选像素的颜色是否发生了变化,我该怎么做?(我试图检查运动)

我在想我可以做这样的事情:

也许用它来从位置中提取颜色?不确定我这样做是否正确,但在那之后我应该重新运行这个方法,比较两个数组的相似之处吗?如果相似度的数量达到某个阈值,则声明图像已更改?

0 投票
1 回答
1971 浏览

html - 在 CSS 中提取和缩放图像的一部分

我想显示图像的一部分,并在网页中缩放我显示的图像部分(更大或更小)。使用 css 显示图像的一部分真的很容易,例如:

这会在 url “myurl.jpg” 处拉入图像,并在该图像的位置 100,100 处显示一个 100 px 正方形的框:所以你看到的 myurl.jpg 就是那个小框。但是,我想让这个框在我的网页中变大或变小,比如将其缩放 50 px 正方形。我可以看到很多缩放背景图像的方法,同时显示它。(例如,非常简洁的 backstretch 插件(http://srobbin.com/jquery-plugins/backstretch/)。但我不明白如何同时提取和缩放。

请出主意!(我在 JQueryMobile 工作,所以答案需要在那里工作)

0 投票
1 回答
3927 浏览

sharepoint - FFmpeg 代码不适用于用于缩略图提取的 http url

我正在尝试从 sharepoint 2013 视频库中提取缩略图。我找到了一个可以使用 ffmpeg 提取的链接。这是链接:[如何将视频的第一帧保存为图像?

当我用 sharepoint 站点 url 和视频名称替换输入文件时,它不会产生任何缩略图。我也给出了错误

我想了解如何使它适用于 http url。如果无法在 ffmpeg 中使用 url,任何人都可以建议另一种方法来实现缩略图。(因为如果没有手动设置,我希望使用视频的第一帧自动设置缩略图)

0 投票
1 回答
6584 浏览

python - How to extract images from a PDF in pure Python?

I'm developing a service in which I now need to extract images from a PDF file. From a Linux command line I can extract images using the Poppler library like this:

Since I'm using the Python Flask framework and I want to run my service on Heroku I want to extract the images using pure Python (or any library that can run on Heroku in a Flask system).

So does anybody know how I can extract images from pdf in pure Python? I prefer open source solutions, but I'm willing to pay for it if needed (as long as it works under my own control on Heroku).

0 投票
2 回答
320 浏览

java - 如何从在线pdf中提取照片和文本

我知道已经有了PDFboxiText但他们没有提取视觉内容的能力,也不需要离线处理 pdf。另外,我想要一种在线提取文本和视觉内容的方法。不想下载pdf文件然后做事。Java 语言有什么样的 API 或库?

对那些觉得不清楚的人进行编辑,我再解释一下:

想象一下,当使用任何HTML parser你可以在线解析页面时,制作DOMSAX树并浏览它们的元素,然后根据这些树中节点的内容提取照片和文本。至少,对于照片,您可以获得相应的 HTML 标签,对于文本,同样可以获取实际文本。现在,我想知道对 PDF 是否有类似的处理?无需下载即可浏览文本和图像

0 投票
3 回答
575 浏览

magento - 从电子商务产品页面中提取主要产品图像

我正在寻找从零售商网站上的产品页面中提取主图像的选项,问题是产品页面中有多个图像(相关图像),我认为可行的一种方法是提取所有图像链接,下载其中的每一个并比较这些图像的大小,并将存储字节数最大的一个视为主要产品图像。

显然这是一种非常低效的方法,我们知道大多数零售商都使用某些电子商务平台,例如 magento、bigcommerce 等,主要的电子商务平台屈指可数,是否可以检测电子商务平台并利用每个平台提供的模板他们中的哪些人可以精确提取主要产品图像?

我知道这种方法永远不会完美,但我正在寻找一种算法,它的准确率大约在 80% 左右,可行吗?

0 投票
1 回答
1993 浏览

python - 如何使用 NumpyArrayToRaster() 从 4 波段图像中提取 3 波段?

我需要从 4 波段图像中提取 3 波段。我正在使用一个名为 NumpyArrayToRaster() 的函数,它最多只能接受 3 个波段图像。我如何使它适用于 4 波段图像?

这是我现在的代码-