问题标签 [image-processing]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
5856 浏览

在图像中定位文本

我目前正在做一个项目,我的目标是在图像中定位文本。到目前为止,我还没有对文本进行 OCR 处理。我想基本上获得图像中文本的边界。我正在使用 AForge.Net 成像组件进行操作。在某种意义上有任何帮助吗?

2009 年 2 月 5 日更新:从那以后,我在我的项目中走上了另一条路线。但是,我确实尝试使用 MODI(Microsoft Office Document Imaging)获取文本。它允许您轻松地对图像进行 OCR 并从中提取文本。

0 投票
9 回答
143074 浏览

比较两个图像的算法

给定两个不同的图像文件(以我选择的任何格式),我需要编写一个程序来预测一个是否是另一个的非法副本的机会。副本的作者可能会做一些事情,比如旋转、制作负片或添加琐碎的细节(以及更改图像的尺寸)。

你知道做这种工作的任何算法吗?

0 投票
17 回答
108804 浏览

如何测量两张图像之间的相似度?

我想将一个应用程序(可能是网页)的屏幕截图与之前截取的屏幕截图进行比较,以确定该应用程序是否正确显示自身。我不想要完全匹配比较,因为方面可能略有不同(对于 Web 应用程序,取决于浏览器,某些元素可能位于稍微不同的位置)。它应该衡量屏幕截图的相似程度。

是否有已经这样做的库/工具?你将如何实施它?

0 投票
8 回答
98736 浏览

图像处理,在 Python 中?

我最近遇到了一个至少需要基本图像处理程度的问题,我可以在 Python 中做到这一点,如果可以,用什么?

0 投票
16 回答
63944 浏览

最快的高斯模糊实现

你如何实现最快的高斯模糊算法?

我打算用 Java 实现它,所以排除了GPU解决方案。我的应用程序planetGenesis是跨平台的,所以我不想要JNI

0 投票
6 回答
1067 浏览

SO上的用户ID图像是如何生成的?

我对这个网站上与每个用户相关的可爱的小万花筒图像有点好奇。那些是如何产生的?可能性是:

  1. 图像列表已经存在于某个文件夹中,并且是随机选择的。
  2. 每当用户注册时都会生成图像。

无论如何,我更感兴趣的是使用什么样的算法来生成这样的图像。

0 投票
2 回答
2108 浏览

在图像中混合渐变填充角的算法

我需要在图像周围放置一个 alpha 混合渐变边框。我的问题是混合角落,使它们在水平和垂直渐变相遇的地方平滑。我相信有一个标准算法可以解决这个问题。我想我什至多年前在学校遇到过它。但是我在几次网络搜索中都没有找到对其中之一的任何引用。

(我已经在角落实现了径向填充图案,但过渡仍然不够平滑。)

我的问题

  1. 如果有解决这个问题的标准算法,它的名称是什么,更好的是,它是如何实现的?

  2. 放弃任何标准算法,确定所需像素值以在角落产生平滑渐变的最佳方法是什么?(从垂直渐变平滑过渡到水平渐变。)

编辑:所以想象我有一个图像,我将插入一个更大的图像之上。较大的图像是纯黑色,较小的图像是纯白色。在我插入之前,我想通过在较小的图像上设置 alpha 值来将较小的图像混合到较大的图像中,以在它周围创建一个透明的“边框”,使其“淡入”到较大的图像中。做得正确,我应该有一个从黑色到白色的平滑渐变,除了角落和内边缘外,我在任何地方都这样做。

在靠近图像中心的渐变边框边缘,该值将是 255(不透明)。当边界接近外边缘时,alpha 值接近 0。在图像的垂直和水平边界相交的角落,你最终会得到一条对角线。我想消除那条线并平稳过渡。

我需要的是一种算法,该算法确定水平和垂直边缘相遇时在图像角落重叠的每个像素的 alpha 值(0 - 255)。

0 投票
4 回答
12459 浏览

如何从图像中读取条形码

我正在寻找有关如何从图像中读取EAN-13条形码(包括ISBNISSN编码)的库、技术或建议。图像可能来自手机或网络摄像头,因此分辨率可能很差且对齐不佳。

我对可以从 ruby​​ on rails 使用的东西特别感兴趣,但是欢迎其他语言的答案。首选开源解决方案。

迄今为止领先的解决方案:

  1. ZBar(以前称为 Zebra - h/t @bgbg、@Natim)- 用 C 语言实现,具有 Python、Perl 和 C++ 接口
  2. ZXing (h/t @codr) - 在 Java(J2SE 和 Android)中实现,其他模块/端口处于不同的开发状态(JavaME、C#、C++、JRuby、RIM、iPhone/Objective C)
0 投票
6 回答
54258 浏览

从实时视频设备捕获图像以供基于 Java 的应用程序使用的最佳方法是什么?

我正在研究用于对某些场景进行半实时检测的图像处理问题。我的目标是让实时视频以某种方式在我的 Java 代码中以 Motion JPEG 帧的形式出现。

我熟悉Java 媒体框架,遗憾的是,我认为我们可以认为这是一个有效的死 API。我也熟悉Axis 盒子,虽然我真的很喜欢他们的解决方案,但如果我对我的特定兴趣点提出任何批评性反馈,我将不胜感激。

出于本次讨论的目的,这就是我定义“最佳”的方式:

  • 延迟 - 如果我使用此视频流控制相机,我希望尽可能将往返延迟保持在 100 毫秒以下。这是从我的控制输入到我看到可见变化之间的时间来衡量的。稍后编辑:要记住的另一件事是相机控制可能是手动和自动(事件触发器)的组合。即使高质量的提要单独存档,我们也需要立即查看这些图片。
  • 成本免费/开源总比不免费好。
  • 可调整的编解码器参数 - 我需要能够针对某些情况调整编解码器。有时,高速低分辨率流实际上更容易处理。
  • 与 Java 的“集成”——将这个解决方案与我的代码挂钩有多麻烦?我是否通过套接字发送数据包?点击网址?安装 Direct3D / JNI 组合?
  • Windows/Linux/两者?- 我更喜欢与操作系统无关的解决方案,因为我必须提供多种操作系统,但可能有一种解决方案对其中一种而言是最佳的,而对另一种则不是。

注意:我知道其他图像/视频捕获编解码器,这不是这个问题的重点。由于帧精度的损失,我对流 API(例如 MPEG4)特别不感兴趣。但是,如果我的问题有一个解决方案可以提供另一个帧精确的数据流,请加入。

跟进这个问题:在这一点上,我强烈倾向于购买Axis 视频编码器等设备,而不是尝试在软件中或直接在 PC 上捕获视频。但是,如果有人有其他选择,我很乐意听到他们的声音。

0 投票
10 回答
10510 浏览

计算图像中唯一颜色数量的算法

寻找一个速度足够快且记忆犹新的。该图像是 24bpp System.Drawing.Bitmap。