2

我正在使用词袋模型对医学图像进行分类。我做了以下提取特征向量:

  1. 从小图像块中提取特征,然后在这些特征上应用 BOW
  2. 从小图像块中提取像素值,然后对这些像素值应用 BOW

在特征提取之后,我尝试了 PCA、特征选择、更改 KMeans 的集群数量等以提高准确性。但在我的例子中,BOW 在像素值 (1) 上学习的表现优于 BOW (90%) 在特征 (2) 上学习的效果 (70%)。我的功能很好,当我使用这些功能使用其他框架对图像进行分类时,我能够获得超过 95% 的准确率。

我的问题是为什么在像素上学习的 BOW 比在特征上学习的 BOW 表现更好?

在此处输入图像描述 在此处输入图像描述

正常-异常结肠镜图像分类

    Figure 1: a normal colon image
    Figure 2: an image with polyp
4

1 回答 1

3

我对您从图像补丁中提取特征的两种方法的理解是

特征选择 =“运行 PCA、k-means 或选择像素的某个子集,并构建这些提取值的向量”

Pixel Values = "从图像的 RGB 值创建一个矢量"

事实上,为了从 BOW 特征中获得好的结果,人们通常会使用相对复杂的算法来推导出单个特征。

http://vision.stanford.edu/projects/totalscene/index.html(参考文献#1 中的论文)的项目中,作者从图像块和分割中获取 BOW 特征。对于图像块,它们提取 SIFT 特征,并且对于每个片段,它们具有形状、颜色、位置和纹理特征(请参阅第 2.1 节并遵循参考以更好地描述它们使用的特征)。

在“将场景分解为几何和语义一致的区域”中。(Gould et. al.) 形状、颜色、边缘等特征是通过训练增强逻辑回归分类器、Potts 模型和高斯混合模型等操作得出的。

您可能不需要如此密集的技术来提取优于像素向量的特征,但您绝对应该浏览文献以了解什么是有效的。

用于提取纹理响应的 SIFT 特征、颜色直方图和过滤器似乎工作得很好,并且还具有合理数量的软件库支持。

于 2012-06-23T19:39:01.307 回答