问题标签 [image-segmentation]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
machine-learning - 如何解析具有任意数量邻居的 CFG?
我正在开发一个项目,该项目试图使用上下文无关语法来解析图像。我们正在尝试构建图像片段树,然后使用机器学习使用这些视觉语法来解析图像。
我发现SVM-CFG看起来很理想,问题是它是为字符串解析而设计的,字符串中的每个终端最多有两个邻居(之前和之后的单词)。在我们的视觉语法中,每个片段可以紧挨着任意数量的其他片段。
解析这些视觉语法的最佳方法是什么?具体来说,我可以对我的数据进行编码以使用 SVM-CFG 吗?还是我必须编写自己的内核/解析库?
matlab - 我如何在matlab中实现这个算法
我正在研究虹膜识别系统。我想通过分析图像中的连通分量来找到瞳孔bwconncomp
。
瞳孔检测算法如下:
- 连接组件标签通过扫描图像来工作。它根据像素连通性将像素分组为组件。连接组件中的所有像素共享相似的像素强度值,并且以某种方式相互连接。
- 一旦确定了所有像素组,就标记该组中的每个像素。确定所有组的中心和直径,直径最大的一组是瞳孔。
- 位于虹膜上方和下方的图像部分被睫毛和眼睑遮挡。这些像素位于瞳孔直径的上方和下方。要删除它们,请将这些像素设置为 NaN(不是数字)。
- 发现最小/最大光圈半径为 90/125。基于此,瞳孔左右 45 个像素被认为是所提出算法分析的虹膜区域。
我的问题是:如何将虹膜上方和下方的空间设置为 NaN。以及如何获得与虹膜对应的像素?
我的代码如下:
matlab - 如何将图像转换为字符段?
通常在 OCR 的过程中,图像文件本质上是被切割成段,每个字符都被识别为一个段。例如,
必须转换为类似的东西
此外,是否有任何针对亚洲语言(如泰卢固语)的算法可用于此目的?如果没有,这对英语是怎么做的?
css - 有弹性的分段页脚行为不端。给出了紧凑的实时示例
我需要在浏览器窗口底部固定一个曲线形的可拉伸页脚,其中曲线是图像。我模拟了一个活生生的例子。
为了通过页脚图像的透明部分最大限度地减少较低层中“可点击”房地产的损失,我的直觉是将图像切割成几个部分(示例中的红色框)并将它们彼此相邻放置,如下所示:
在大多数主流浏览器(不是 IE 和 FF)中,随着窗口大小的调整,细线断裂在框之间来来去去,这是不可接受的。
浮动图像片段可以解决问题,但我还没有找到一种实现方法,仍然将页脚固定到底部并保留提到的“可点击性”。有没有比我更好的方法来解决这个问题,或者可以以某种方式补救?
关于给出的示例的注意事项:示例中的曲线图像本身尚未被剪切,它仍然是单个图像。此外,蓝色框不是问题,它们不会拉伸,因此不会受到问题的影响。
我会对这种行为的原因和任何可行的解决方案感兴趣。谢谢。
image-processing - 如何根据颜色和大小分割对象?
我有两个使用 Open-CV 处理的图像处理问题。
- 识别彼此不同颜色的相似物体。
- 识别彼此不同大小的相似颜色对象。
场景 1 和 2 的示例图像;
1
2
两幅图像都具有三种类型的感兴趣对象。(三种颜色或尺寸)
我遇到的技术包括阈值化,然后使用带有像素计数的腐蚀,使用 RGB 值进行颜色分割。
什么是好的工作链,什么是好的起点?
c# - emgu 两只手检测
我想检测两只手(使用 HSV 过滤图像)。
问题是当我把两只手放在一起时,头会夹在中间,然后就无法识别手了。
我在应用程序启动时使用 Haar 检测两只手,然后我将图像转换为 HSV(黑白)。然后我使用分割来检测物体的中心质量,这样我就可以跟随它们。我忽略了它们面积足够小的物体。
任何想法我该如何解决这个问题?
c++ - OpenCV:如何正确分割带有阈值的图像/使用二进制图像分割原始图像?
我目前正在开发一个带有乳房 X 线摄影术的项目,并且我正在尝试理解如何将图像分割成两个部分:可搜索区域 (ROI) 和不可搜索区域。这个问题的重点仅针对实际图像分析/处理的底层算法。来自 Google 和 Stack Overflow 的大多数结果都产生了有用的信息,但它们都没有解释图像分析/处理的步骤以及为什么这些步骤很重要以及它们各自在做什么。
我编写了一个小代码段,它获取图像、重新调整图像大小并“二值化”图像。(如下。)有什么方法可以在我的二进制图像上追踪一条线(轮廓?),将这条线移动到我的原始图像,并将其用作让我的算法确定可搜索区域(ROI)从非可搜索区域?有没有更简单的方法来做到这一点?
为了澄清和重申,我查看了很多教程,但没有任何帮助,特别是。我将不胜感激我能得到的所有帮助!
opencv - OpenCV - 两个二进制图像之间的交集
假设我有两个相同大小的二进制图像。如何找到两个二进制图像之间的交集?只有两个白色(灰色 - 255)图像上相同坐标(位置)的像素才会在输出图像(交叉点)上给出白色像素。
image-processing - Haralick 的标注算法很好的解释
你会如何解释 Haralick 的标注算法(带有前言和后向迭代)?