我正在实现基于直方图、HOG 和局部二进制模式的特征提取的基于内容的图像检索 (CBIR)。这些(标准化)特征提取中的每一个都单独存储在csv
文件中,以在进一步的步骤中计算距离。该文件如下所示:
img_ID0, 0.0, 0.0, 0.0, 0.4, 0.1, ...
img_ID1, 0.0, 0.1, 0.0, 0.2, 0.1, ...
img_ID2, 0.2, 0.0, 0.0, 0.4, 0.0, ...
我ndarray
沿着整个展平的阵列展平和归一化。哪个应该是样本标准化(我不确定,所以请纠正我)
现在,基于特征的标准化会是什么样子?特别是如果我真的没有“命名”列?我应该沿着(未展平的)图像标准化还是稍后在所有图像的展平阵列上按列标准化?
文献只是说,特征明智是常用的,但它仍然取决于应用程序。CBIR 似乎对此非常模糊。