我需要能够验证用户是否正确绘制了形状,从简单的形状(如圆形、三角形)和更高级的形状(如字母 A)开始。
我需要能够实时计算正确性,例如,如果用户应该画一个圆但正在画一个矩形,我希望能够在绘制时检测到这一点。
形状识别有几种不同的方法,不幸的是我没有经验或时间去尝试所有这些方法,看看哪些方法有效。
对于这项特定任务,您会推荐哪种方法?
感谢您的帮助。
我需要能够验证用户是否正确绘制了形状,从简单的形状(如圆形、三角形)和更高级的形状(如字母 A)开始。
我需要能够实时计算正确性,例如,如果用户应该画一个圆但正在画一个矩形,我希望能够在绘制时检测到这一点。
形状识别有几种不同的方法,不幸的是我没有经验或时间去尝试所有这些方法,看看哪些方法有效。
对于这项特定任务,您会推荐哪种方法?
感谢您的帮助。
我们可以将“识别”定义为检测元素中的特征/特征并将它们与我们经验中看到的已知元素的特征进行比较的能力。具有相似特征的对象可能是相似对象。特征的数量和复杂度越高,我们区分相似对象的能力就越大。
在形状的情况下,我们可以使用它们的几何属性,例如角度数、角度值、边数、边大小等。因此,为了完成您的任务,您应该使用图像处理算法从图纸中提取这些特征。
下面我提出了一个非常简单的方法,在实践中展示了这个概念。我们将使用角的数量来识别不同的形状。正如我所说:“特征的数量和复杂性越高,我们区分相似对象的能力就越大”。由于我们只使用一个特征,即角的数量,我们可以区分几种不同的形状。将不区分具有相同角数的形状。因此,为了改进该方法,您可能会添加新功能。
为了实时完成此任务,您可以实时提取特征。如果要绘制的对象是三角形并且用户正在绘制任何其他图形的第四条边,那么您知道他或她不是在绘制三角形。关于正确程度,您可以计算所需对象的特征向量与绘制的特征向量之间的距离。
输入:
算法
软件:
下面介绍的软件是用 Java 开发的,并使用Marvin 图像处理框架。但是,您可以使用任何编程语言和工具。
import static marvin.MarvinPluginCollection.floodfillSegmentation;
import static marvin.MarvinPluginCollection.moravec;
import static marvin.MarvinPluginCollection.scale;
public class ShapesExample {
public ShapesExample(){
// Scale down the image since the desired features can be extracted
// in a lower resolution.
MarvinImage image = MarvinImageIO.loadImage("./res/shapes.png");
scale(image.clone(), image, 269);
// segment each object
MarvinSegment[] objs = floodfillSegmentation(image);
MarvinSegment seg;
// For each object...
// Skip position 0 which is just the background
for(int i=1; i<objs.length; i++){
seg = objs[i];
MarvinImage imgSeg = image.subimage(seg.x1-5, seg.y1-5, seg.width+10, seg.height+10);
MarvinAttributes output = new MarvinAttributes();
output = moravec(imgSeg, null, 18, 1000000);
System.out.println("figure "+(i-1)+":" + getShapeName(getNumberOfCorners(output)));
}
}
public String getShapeName(int corners){
switch(corners){
case 3: return "Triangle";
case 4: return "Rectangle";
case 5: return "Pentagon";
}
return null;
}
private static int getNumberOfCorners(MarvinAttributes attr){
int[][] cornernessMap = (int[][]) attr.get("cornernessMap");
int corners=0;
List<Point> points = new ArrayList<Point>();
for(int x=0; x<cornernessMap.length; x++){
for(int y=0; y<cornernessMap[0].length; y++){
// Is it a corner?
if(cornernessMap[x][y] > 0){
// This part of the algorithm avoid inexistent corners
// detected almost in the same position due to noise.
Point newPoint = new Point(x,y);
if(points.size() == 0){
points.add(newPoint); corners++;
}else {
boolean valid=true;
for(Point p:points){
if(newPoint.distance(p) < 10){
valid=false;
}
}
if(valid){
points.add(newPoint); corners++;
}
}
}
}
}
return corners;
}
public static void main(String[] args) {
new ShapesExample();
}
}
软件输出:
figure 0:Rectangle
figure 1:Triangle
figure 2:Pentagon
另一种方法是您可以使用与您比较它的点的距离最小的每个点的平均值来解决这个问题,首先您必须使用形状库中的形状调整形状,然后:
function shortestDistanceSum( subject, test_subject ) {
var sum = 0;
operate( subject, function( shape ){
var smallest_distance = 9999;
operate( test_subject, function( test_shape ){
var distance = dist( shape.x, shape.y, test_shape.x, test_shape.y );
smallest_distance = Math.min( smallest_distance, distance );
});
sum += smallest_distance;
});
var average = sum/subject.length;
return average;
}
function operate( array, callback ) {
$.each(array, function(){
callback( this );
});
}
function dist( x, y, x1, y1 ) {
return Math.sqrt( Math.pow( x1 - x, 2) + Math.pow( y1 - y, 2) );
}
var square_shape = Array; // collection of vertices in a square shape
var triangle_shape = Array; // collection of vertices in a triangle
var unknown_shape = Array; // collection of vertices in the shape your'e comparing from
square_sum = shortestDistanceSum( square_shape, unknown_shape );
triangle_sum = shortestDistanceSum( triangle_shape, unknown_shape );
其中最低和是最接近的形状。
您有两个输入 - 初始图像和用户输入 - 您正在寻找布尔结果。
理想情况下,您会将所有输入数据转换为可比较的格式。相反,您还可以参数化这两种类型的输入并使用监督机器学习算法(最近邻会想到封闭形状)。
诀窍在于找到正确的参数。如果您的输入是平面图像文件,则这可能是二进制转换。如果用户输入是滑动动作或笔划,我确信有办法将其捕获并映射为二进制,但如果它使用最接近原始输入的数据,该算法可能会更稳健。