1

我正在尝试使用BriefBRISKAKAZ E 和FREAK二进制描述符进行特征检测和描述。

我正在使用MINIST视觉数据集的 28x28 图像进行测试,如下所示:

在此处输入图像描述

我通过以下方式调用了所有方法:

快速地:

FAST = cv.FastFeatureDetector_create(threshold = 80,
                                     nonmaxSuppression = True)

简短的:

BRIEF = cv.xfeatures2d.BriefDescriptorExtractor_create(bytes = 16,
                                                       use_orientation = False)

轻快:

BRISK = cv.BRISK_create(thresh = 30,
                        octaves = 0,
                        patternScale = 1.0)

阿卡兹:

AKAZE = cv.AKAZE_create(descriptor_type = cv.AKAZE_DESCRIPTOR_MLDB,
                        descriptor_size = 0,
                        descriptor_channels = 3,
                        threshold = 0.001,
                        nOctaves = 4,
                        nOctaveLayers = 4,
                        diffusivity = cv.KAZE_DIFF_PM_G2)

怪物:

FREAK = cv.xfeatures2d.FREAK_create(orientationNormalized = True,
                                    scaleNormalized = True,
                                    patternScale = 22.0,
                                    nOctaves = 4)

注 1:我将描述符BriefFREAKFAST Detector 一起使用。

我找到了关键点并计算了描述符,如下所示:

keypoints = FAST.detect(image, None)
keypoints, descriptors = BRIEF.compute(image, keypoints)

请注意,在此示例中,我试图找到 Keyponts 并计算简要描述符,但对于上述所有描述符,我得到以下输出:

print("Keyponts:", keypoints, "\n")

print("Descriptors:", descriptors, "\n")

Keyponts: [] 

Descriptors: None 

注意 2:我使用了与任何其他 640x546 尺寸图像相同的参数,并且我能够找到关键点并计算描述符。问题是我正在搜索需要使用MINIST视觉数据集的地方。

注 3:使用SIFTSURFKAZEORB等其他描述符,我能够找到 Keyponts 并计算相同视觉数据集的描述符。

我已经多次更改了所有描述符的参数,但不幸的是,我在可视数据集MNIST中找不到关键点并用它们计算描述符。我想知道是否有正确的方法来选择这些参数,或者我是否可以做些什么。

我认为在大小为 28x28 (?)的小图像(?)中使用这些描述符查找关键点和计算机描述符存在问题。

我正在使用Python 3.6OpenCV 4.1(带有opencv_contrib模块)。

4

1 回答 1

1

原因:

MNIST如问题中所述,图像为 28x28 像素。

为了找到关键点和计算描述符,显着的描述符喜欢SIFT并且SURF可以在更小的补丁中获得很好的结果,但是,许多描述符(例如ORB)在 32x32 补丁中获得了很好的结果。

由于图像较小,因此无法MNIST使用描述符BRIEFBRISKAKAZE和获得结果。FREAKMNIST

解决方案:

为避免返回没有描述符的关键点,BRIEF, BRISK, AKAZE, 并FREAK删除关键点。这样,可以观察到这些描述符不适合MNIST数据集中存在的图像。

其他测试:

但是,使用描述符BRIEFBRISKAKAZEFREAK,可以使用具有更大补丁的任何其他图像(在本实验中为 640x546 补丁)获得结果(使用问题中提供的相同参数)。

BRIEF

在此处输入图像描述

BRISK

在此处输入图像描述

AKAZE

在此处输入图像描述

FREAK

在此处输入图像描述

这样,可以观察到大小为 640x546 像素的图像具有更显着的特征。

我希望这个答案可以帮助其他有同样问题的人。

要了解有关检测和描述技术的更多信息,我推荐 GitHub 上的以下存储库:

于 2021-02-06T20:29:45.227 回答