我需要在 RGB 图像上使用高斯混合模型,因此数据集非常大。这需要实时运行(来自网络摄像头)。我首先用 Matlab 进行了编码,我能够为 1729 × 866 的图像实现 0.5 秒的运行时间。最终应用程序的图像会更小,因此时间会更快。

但是,我需要使用 Python 和 OpenCV 为最终应用程序实现这一点(我需要它在嵌入式板上运行)。我翻译了我所有的代码并使用 sklearn.mixture.GMM 来替换 Matlab 中的 fitgmdist。计算 GMM 模型本身的代码行仅在 7.7e-05 秒内执行,但拟合模型需要 19 秒。我尝试过其他类型的协方差,例如“诊断”或“球形”,时间确实减少了一点,但结果更糟,时间仍然不够好,甚至没有接近。

我想知道是否有任何其他库可以使用,或者将函数从 Matlab 转换为 Python 是否值得。


import cv2
import numpy as np
import math
from sklearn.mixture import GMM

im = cv2.imread('Boat.jpg');

h, w, _ = im.shape;       # Height and width of the image

# Extract Blue, Green and Red
imB = im[:,:,0]; imG = im[:,:,1]; imR = im[:,:,2];

# Reshape Blue, Green and Red channels into single-row vectors
imB_V = np.reshape(imB, [1, h * w]);
imG_V = np.reshape(imG, [1, h * w]);
imR_V = np.reshape(imR, [1, h * w]);

# Combine the 3 single-row vectors into a 3-row matrix
im_V =  np.vstack((imR_V, imG_V, imB_V));

# Calculate the bimodal GMM
nmodes = 2;
GMModel = GMM(n_components = nmodes, covariance_type = 'full', verbose = 0, tol = 1e-3)
GMModel = GMModel.fit(np.transpose(im_V))



1 回答 1


您可以尝试使用“对角线”或球形协方差矩阵而不是完整的。 covariance_type='diag' 或者 covariance_type='spherical'


于 2016-08-21T11:14:23.017 回答