我想编写一个算法,可以获取图片的一部分并将它们与同一对象的另一张图片相匹配。
例如,如果我给计算机一张花瓶的图片和一张带有花瓶的场景图片,我希望它能够确定花瓶在图像中的位置。我将如何开始开发这样的算法?
该算法的最终用途将是一个应用程序,例如,使用某人的面部照片可以判断他们是否在人群中。该算法最终将应用于视频流。
编辑:我不期待这个问题的实际解决方案,因为我不希望很快解决它。真正的问题是你如何为计算机定义这样的东西,以便你可以制定一个算法来做到这一点。
谢谢
我想编写一个算法,可以获取图片的一部分并将它们与同一对象的另一张图片相匹配。
例如,如果我给计算机一张花瓶的图片和一张带有花瓶的场景图片,我希望它能够确定花瓶在图像中的位置。我将如何开始开发这样的算法?
该算法的最终用途将是一个应用程序,例如,使用某人的面部照片可以判断他们是否在人群中。该算法最终将应用于视频流。
编辑:我不期待这个问题的实际解决方案,因为我不希望很快解决它。真正的问题是你如何为计算机定义这样的东西,以便你可以制定一个算法来做到这一点。
谢谢
我以前的一位老师就类似的问题写过他的博士论文,除了他的输入是某物的详细 3D 模型,他将使用该模型在 2D 图像中找到该对象。这是一个非常重要的问题,没有单一的“答案”,当然也没有任何符合 Stack Overflow 格式的问题。
我的最佳答案是:筹集大量资金并聘请一位经验丰富的程序员。
祝你好运。
简单的答案是,找到一种描述人脸的数学方法,可以解释角度和部分缺失数据,然后对其进行改进和教学。
显然苹果已经做了这样的事情,但是,它仍然会犯错误,并且必须在前进的过程中被教导。
我希望它更多地是关于数学,而不是关于编程。
您描述的第一个问题和第二个问题都完全不同。
每个问题的主要部分都由众多可用的机器视觉库解决。您可能需要多种技术组合才能在任一项任务中取得任何成功。
在第一个中,您需要一般识别对象的东西。可能我会协同使用多种算法来识别模型图像中的前景对象,然后对分区目标图像进行某种加权比较。
在第二种情况下,相对于上面的一般识别器,检查人脸是一个困难得多的问题。面孔看起来都一样,或者几乎一样。一般识别器会注意到的东西不太可能有利于区分人脸。您需要一种已经针对面部识别进行了调整的算法。幸运的是,这是一个快速成熟的领域,您可能可以像第一种情况一样做到这一点,但使用一组不同的功能。
我想你会发现这是一个相当大的挑战。这是一个极其困难的问题,是属于人工智能 (AI) 领域的众多计算领域之一。面部识别肯定是这个问题最流行的变体,不管你在媒体上读到什么,任何声称的成功都不是他们想象的那样。我认为最接近的解决方案涉及神经网络,它们通常需要非常清晰和精心挑选的图像。
不过,您可以尝试在这里阅读。祝你好运!