由于您的假设,参考和目标位于(大约)同一平面上。您可以应用“算法 1:平面测量”中描述的方法
安东尼奥·克里米尼西。“单视图计量:算法和应用(特邀论文)”。在:模式识别。埃德。作者:卢克·范古尔。卷。2449. 计算机科学讲义。施普林格柏林海德堡,2002 年,第 224-239 页。
该方法允许您测量位于同一平面上的两点之间的距离。
基本上
P=H*p (1)
其中p
是图像中以齐次坐标表示P
的点,是 3D 世界平面中的对应点,也以齐次坐标表示,并且H
是称为单应矩阵的 3x3 矩阵,*
是矩阵向量乘法。
h11 h12 h13
H = h21 h22 h23
h31 h32 h33
的度量单位p
是像素,因此例如,如果是行和列p
的一个点,它将表示为。测量单位是您的世界单位,例如米,您可以假设您的 3D 世界平面是平面,因此表示为齐次向量。r
c
[r,c,1]
P
Z=0
P
[X,Y,1]
所以对“算法1:平面测量”稍作修改。如下:
给定一个平面图像,估计图像到世界的单应矩阵 H。假设 H 的 9 个元素是无量纲的。
在图像中,选择两个点p1=[r1,c1,1]
并且p2=[r2,c2,1]
属于参考对象。
通过 (1) 将每个图像点反向投影到世界平面中,以获得两个世界点P1
和P2
。您进行矩阵向量乘法,然后将结果向量除以第三个分量,以获得齐次向量。例如P1=[X1,Y1,1]
是P1=[(c1*h_12 + h_11*r1 + h_13)/(c1*h_32 + h_31*r1 + h_33),(c1*h_22 + h_21*r1 + h_23)/(c1*h_32 + h_31*r1 + h_33),1]
. 暂时假设 的九个元素H
是无量纲的,这意味着 , , , 的度量X1
单位Y1
是X2
像素Y2
。
计算 和R
之间的距离P1
,P2
即R=sqrt(pow(X1-X2,2)+pow(Y1-Y2,2)
,R
仍以像素表示。现在,由于P1
和P2
位于参考对象上,这意味着您知道它们之间的距离(以米为单位),我们称其为距离,以米为单位表示M
。
将比例因子计算s
为s=M/R
, 的维度s
是每像素米。
H
将by 的每个元素相乘s
并调用G
你得到的新矩阵。现在 的元素以G
每像素米表示。
现在,在图像中选择两个点p3
并且p4
属于目标对象。
Back-projectp3
和p4
viaG
以获得P3
和P4
. P3=G*p3
和P4=G*p4
。再次将每个向量除以其第三个元素。
P3=[X3,Y3,1]
和P4=[X4,Y4,1]
现在X3
, Y3
,X4
和Y4
用米表示。
D
计算 和之间所需的目标距离P3
,P4
即D=sqrt(pow(X3-X4,2)+pow(Y3-Y4,2)
。D
现在以米表示。
上述论文的附录解释了如何计算H
或者例如你可以使用 OpenCV cv::findHomography
:基本上你需要在现实世界中的点和图像中的点之间至少有四个对应关系。
关于如何估算的另一个信息来源H
是
约翰逊,弥迦 K.;法里德,汉尼。来自单个图像的平面上的公制测量。部门计算。科学,达特茅斯学院,科技。众议员 TR2006-579,2006。
如果您还需要估计测量的准确性,您可以在
A. 克里米尼西。来自单个和多个未校准图像的准确视觉计量。杰出论文系列。Springer-Verlag London Ltd.,2001 年 9 月。国际标准书号:1852334681。
使用 OpenCV 的 C++ 示例:
#include "opencv2/core/core.hpp"
#include "opencv2/imgproc/imgproc.hpp"
#include "opencv2/highgui/highgui.hpp"
#include "opencv2/calib3d/calib3d.hpp"
void to_homogeneous(const std::vector< cv::Point2f >& non_homogeneous, std::vector< cv::Point3f >& homogeneous )
{
homogeneous.resize(non_homogeneous.size());
for ( size_t i = 0; i < non_homogeneous.size(); i++ ) {
homogeneous[i].x = non_homogeneous[i].x;
homogeneous[i].y = non_homogeneous[i].y;
homogeneous[i].z = 1.0;
}
}
void from_homogeneous(const std::vector< cv::Point3f >& homogeneous, std::vector< cv::Point2f >& non_homogeneous )
{
non_homogeneous.resize(homogeneous.size());
for ( size_t i = 0; i < non_homogeneous.size(); i++ ) {
non_homogeneous[i].x = homogeneous[i].x / homogeneous[i].z;
non_homogeneous[i].y = homogeneous[i].y / homogeneous[i].z;
}
}
void draw_cross(cv::Mat &img, const cv::Point center, float arm_length, const cv::Scalar &color, int thickness = 5 )
{
cv::Point N(center - cv::Point(0, arm_length));
cv::Point S(center + cv::Point(0, arm_length));
cv::Point E(center + cv::Point(arm_length, 0));
cv::Point W(center - cv::Point(arm_length, 0));
cv::line(img, N, S, color, thickness);
cv::line(img, E, W, color, thickness);
}
double measure_distance(const cv::Point2f& p1, const cv::Point2f& p2, const cv::Matx33f& GG)
{
std::vector< cv::Point2f > ticks(2);
ticks[0] = p1;
ticks[1] = p2;
std::vector< cv::Point3f > ticks_h;
to_homogeneous(ticks, ticks_h);
std::vector< cv::Point3f > world_ticks_h(2);
for ( size_t i = 0; i < ticks_h.size(); i++ ) {
world_ticks_h[i] = GG * ticks_h[i];
}
std::vector< cv::Point2f > world_ticks_back;
from_homogeneous(world_ticks_h, world_ticks_back);
return cv::norm(world_ticks_back[0] - world_ticks_back[1]);
}
int main(int, char**)
{
cv::Mat img = cv::imread("single-view-metrology.JPG");
std::vector< cv::Point2f > world_tenth_of_mm;
std::vector< cv::Point2f > img_px;
// Here I manually picked the pixels coordinates of the corners of the A4 sheet.
cv::Point2f TL(711, 64);
cv::Point2f BL(317, 1429);
cv::Point2f TR(1970, 175);
cv::Point2f BR(1863, 1561);
// This is the standard size of the A4 sheet:
const int A4_w_mm = 210;
const int A4_h_mm = 297;
const int scale = 10;
// Here I create the correspondences between the world point and the
// image points.
img_px.push_back(TL);
world_tenth_of_mm.push_back(cv::Point2f(0.0, 0.0));
img_px.push_back(TR);
world_tenth_of_mm.push_back(cv::Point2f(A4_w_mm * scale, 0.0));
img_px.push_back(BL);
world_tenth_of_mm.push_back(cv::Point2f(0.0, A4_h_mm * scale));
img_px.push_back(BR);
world_tenth_of_mm.push_back(cv::Point2f(A4_w_mm * scale, A4_h_mm * scale));
// Here I estimate the homography that brings the world to the image.
cv::Mat H = cv::findHomography(world_tenth_of_mm, img_px);
// To back-project the image points into the world I need the inverse of the homography.
cv::Mat G = H.inv();
// I can rectify the image.
cv::Mat warped;
cv::warpPerspective(img, warped, G, cv::Size(2600, 2200 * 297 / 210));
{
// Here I manually picked the pixels coordinates of ticks '0' and '1' in the slide rule,
// in the world the distance between them is 10mm.
cv::Point2f tick_0(2017, 1159);
cv::Point2f tick_1(1949, 1143);
// I measure the distance and I write it on the image.
std::ostringstream oss;
oss << measure_distance(tick_0, tick_1, G) / scale;
cv::line(img, tick_0, tick_1, CV_RGB(0, 255, 0));
cv::putText(img, oss.str(), (tick_0 + tick_1) / 2, cv::FONT_HERSHEY_PLAIN, 3, CV_RGB(0, 255, 0), 3);
}
{
// Here I manually picked the pixels coordinates of ticks '11' and '12' in the slide rule,
// in the world the distance between them is 10mm.
cv::Point2f tick_11(1277, 988);
cv::Point2f tick_12(1211, 973);
// I measure the distance and I write it on the image.
std::ostringstream oss;
oss << measure_distance(tick_11, tick_12, G) / scale;
cv::line(img, tick_11, tick_12, CV_RGB(0, 255, 0));
cv::putText(img, oss.str(), (tick_11 + tick_12) / 2, cv::FONT_HERSHEY_PLAIN, 3, CV_RGB(0, 255, 0), 3);
}
// I draw the points used in the estimate of the homography.
draw_cross(img, TL, 40, CV_RGB(255, 0, 0));
draw_cross(img, TR, 40, CV_RGB(255, 0, 0));
draw_cross(img, BL, 40, CV_RGB(255, 0, 0));
draw_cross(img, BR, 40, CV_RGB(255, 0, 0));
cv::namedWindow( "Input image", cv::WINDOW_NORMAL );
cv::imshow( "Input image", img );
cv::imwrite("img.png", img);
cv::namedWindow( "Rectified image", cv::WINDOW_NORMAL );
cv::imshow( "Rectified image", warped );
cv::imwrite("warped.png", warped);
cv::waitKey(0);
return 0;
}
输入图像,在这种情况下,您的参考对象是 A4 纸,目标对象是计算尺:
输入带有度量的图像,红叉用于估计单应性:
修正后的图像: