问题标签 [mser]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 为什么要在检测文本之前重塑 MSER 轮廓?
我正在使用来自 opencv-python 的 MSER 来使用来自这个stackoverflow question的代码来检测文本。谁能帮我理解为什么在计算对象的凸包之前将轮廓 p 重塑为 (-1, 1, 2) ?
代码如下:
c - 如何在 VLFeat 中计算 MSER 椭球上的 SIFT 描述符?
我有一个灰度图像(每个像素一个值,介于 0 和 255 之间),我想使用 MSER 算法(即椭圆体)检测关键点,并使用 SIFT 描述符描述这些关键点。我正在使用 VLFeat 库中的函数。
首先,我使用函数vl_mser_get_regions
(返回表示图像中质心位置的值向量)和vl_mser_get_ell
(返回描述椭球的维数为 9 的向量)获取质心和椭球。然后,我想将该函数应用于vl_sift_calc_raw_descriptor
每个先前的椭球,以获得每个椭球的 SIFT 描述符。
我展示了一个我到目前为止所做的示例(省略了非超越代码):
问题是我不知道如何使用描述vl_sift_calc_raw_descriptor
函数中每个椭球的 9 维向量。
image - 文档图像字符补丁识别中的最大稳定极值区域 (MSER) 实现
我的任务是识别文档图像中的字符补丁。考虑下图:
根据论文,为了提取字符块,将采用基于 MSER 的方法来检测字符候选。
“基于 MSER 的方法的主要优点是即使文档图像质量低,这种算法也能够找到最清晰的字符。”
另一篇论文讨论了 MSER。我很难理解后一篇论文。谁能简单地向我解释MSER
在示例文档中实施和提取字符补丁应采取的步骤。我将在 Python 中实现它,我需要完全掌握/理解 MSER 的工作原理。
以下是识别图像文档中字符补丁的步骤(根据我的理解,如果我错了,请纠正我)
“首先,像素按强度排序”
我的理解:
例如,我在图像中有 5 个像素的强度
(Pixel 1) 1, (Pixel 2) 9,(Pixel 3) 255,(Pixel 4) 3,(Pixel 5) 4
连续,然后如果越来越多地排序,基于强度它将产生一个输出,Pixel 1,4,5,2 and 3
.排序后,像素被放置在图像中(以递减或递增的顺序),并使用有效的联合查找算法维护连接组件及其区域的列表。
我的理解:
使用编号 1 中的示例。像素将按如下方式排列。像素组件/组和图像 X、Y 坐标只是示例。
/li>“该过程产生了一个数据结构,将每个连接组件的面积存储为强度的函数。”
我的理解:
将在 #2 的表中添加一列,称为
Area
. 它将计算具有相同强度级别的特定组件中的像素数。它就像组件组内具有相同强度级别的像素的聚合。4.“最后,选择区域函数变化率的局部最小值的强度水平作为产生 MSER 的阈值。在输出中,每个 MSER 由局部强度最小值(或最大值)和阈值的位置表示。 "
如何获得面积函数变化率的局部最小值?
请帮助我了解这是什么以及如何实施 MSER。请随时纠正我的理解。谢谢。
computer-vision - 谁能教我最大稳定极值区域(MSER)公式的详细工作原理?
我现在很困惑,因为我仍然不明白如何在 MSER 的手动计算中找到 maxVariation、minArea、maxArea 和 thresholdDelta 值。特别是关于这个公式,谁能告诉我如何解决这个公式?谢谢。