问题标签 [image-processing]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - 在图像中定位文本
我目前正在做一个项目,我的目标是在图像中定位文本。到目前为止,我还没有对文本进行 OCR 处理。我想基本上获得图像中文本的边界。我正在使用 AForge.Net 成像组件进行操作。在某种意义上有任何帮助吗?
2009 年 2 月 5 日更新:从那以后,我在我的项目中走上了另一条路线。但是,我确实尝试使用 MODI(Microsoft Office Document Imaging)获取文本。它允许您轻松地对图像进行 OCR 并从中提取文本。
algorithm - 比较两个图像的算法
给定两个不同的图像文件(以我选择的任何格式),我需要编写一个程序来预测一个是否是另一个的非法副本的机会。副本的作者可能会做一些事情,比如旋转、制作负片或添加琐碎的细节(以及更改图像的尺寸)。
你知道做这种工作的任何算法吗?
algorithm - 如何测量两张图像之间的相似度?
我想将一个应用程序(可能是网页)的屏幕截图与之前截取的屏幕截图进行比较,以确定该应用程序是否正确显示自身。我不想要完全匹配比较,因为方面可能略有不同(对于 Web 应用程序,取决于浏览器,某些元素可能位于稍微不同的位置)。它应该衡量屏幕截图的相似程度。
是否有已经这样做的库/工具?你将如何实施它?
python - 图像处理,在 Python 中?
我最近遇到了一个至少需要基本图像处理程度的问题,我可以在 Python 中做到这一点,如果可以,用什么?
java - 最快的高斯模糊实现
你如何实现最快的高斯模糊算法?
我打算用 Java 实现它,所以排除了GPU解决方案。我的应用程序planetGenesis是跨平台的,所以我不想要JNI。
image-processing - SO上的用户ID图像是如何生成的?
我对这个网站上与每个用户相关的可爱的小万花筒图像有点好奇。那些是如何产生的?可能性是:
- 图像列表已经存在于某个文件夹中,并且是随机选择的。
- 每当用户注册时都会生成图像。
无论如何,我更感兴趣的是使用什么样的算法来生成这样的图像。
algorithm - 在图像中混合渐变填充角的算法
我需要在图像周围放置一个 alpha 混合渐变边框。我的问题是混合角落,使它们在水平和垂直渐变相遇的地方平滑。我相信有一个标准算法可以解决这个问题。我想我什至多年前在学校遇到过它。但是我在几次网络搜索中都没有找到对其中之一的任何引用。
(我已经在角落实现了径向填充图案,但过渡仍然不够平滑。)
我的问题:
如果有解决这个问题的标准算法,它的名称是什么,更好的是,它是如何实现的?
放弃任何标准算法,确定所需像素值以在角落产生平滑渐变的最佳方法是什么?(从垂直渐变平滑过渡到水平渐变。)
编辑:所以想象我有一个图像,我将插入一个更大的图像之上。较大的图像是纯黑色,较小的图像是纯白色。在我插入之前,我想通过在较小的图像上设置 alpha 值来将较小的图像混合到较大的图像中,以在它周围创建一个透明的“边框”,使其“淡入”到较大的图像中。做得正确,我应该有一个从黑色到白色的平滑渐变,除了角落和内边缘外,我在任何地方都这样做。
在靠近图像中心的渐变边框边缘,该值将是 255(不透明)。当边界接近外边缘时,alpha 值接近 0。在图像的垂直和水平边界相交的角落,你最终会得到一条对角线。我想消除那条线并平稳过渡。
我需要的是一种算法,该算法确定水平和垂直边缘相遇时在图像角落重叠的每个像素的 alpha 值(0 - 255)。
ruby-on-rails - 如何从图像中读取条形码
java - 从实时视频设备捕获图像以供基于 Java 的应用程序使用的最佳方法是什么?
我正在研究用于对某些场景进行半实时检测的图像处理问题。我的目标是让实时视频以某种方式在我的 Java 代码中以 Motion JPEG 帧的形式出现。
我熟悉Java 媒体框架,遗憾的是,我认为我们可以认为这是一个有效的死 API。我也熟悉Axis 盒子,虽然我真的很喜欢他们的解决方案,但如果我对我的特定兴趣点提出任何批评性反馈,我将不胜感激。
出于本次讨论的目的,这就是我定义“最佳”的方式:
- 延迟 - 如果我使用此视频流控制相机,我希望尽可能将往返延迟保持在 100 毫秒以下。这是从我的控制输入到我看到可见变化之间的时间来衡量的。稍后编辑:要记住的另一件事是相机控制可能是手动和自动(事件触发器)的组合。即使高质量的提要单独存档,我们也需要立即查看这些图片。
- 成本免费/开源总比不免费好。
- 可调整的编解码器参数 - 我需要能够针对某些情况调整编解码器。有时,高速低分辨率流实际上更容易处理。
- 与 Java 的“集成”——将这个解决方案与我的代码挂钩有多麻烦?我是否通过套接字发送数据包?点击网址?安装 Direct3D / JNI 组合?
- Windows/Linux/两者?- 我更喜欢与操作系统无关的解决方案,因为我必须提供多种操作系统,但可能有一种解决方案对其中一种而言是最佳的,而对另一种则不是。
注意:我知道其他图像/视频捕获编解码器,这不是这个问题的重点。由于帧精度的损失,我对流 API(例如 MPEG4)特别不感兴趣。但是,如果我的问题有一个解决方案可以提供另一个帧精确的数据流,请加入。
跟进这个问题:在这一点上,我强烈倾向于购买Axis 视频编码器等设备,而不是尝试在软件中或直接在 PC 上捕获视频。但是,如果有人有其他选择,我很乐意听到他们的声音。
c# - 计算图像中唯一颜色数量的算法
寻找一个速度足够快且记忆犹新的。该图像是 24bpp System.Drawing.Bitmap。