绘图和绘画机器人的算法 -
你好
我想编写一个分析图像的软件,然后生成一个图像,该图像捕捉人眼在原始图像中的感知,使用最少的颜色和不透明度变化的贝塞尔路径对象。
与最近的 twitter 超级压缩竞赛(参见:stackoverflow.com/questions/891643/twitter-image-encoding-challenge)不同,我的目标不是创建一个忠实于图像的副本,而是复制人类体验看着图像。
例如,如果原始图像的左上角有一个红色气球,而复制品的左上角有一个看起来像红色气球的东西,那么即使复制品中的气球是位置不完全相同,尺寸或颜色也不完全相同。
当我说“被人类感知”时,我的意思是非常有限的。我不是试图分析图像的含义,我不需要知道图像是什么,我只对人眼会注意到的关键视觉特征感兴趣,只要这可以由算法无法概念化它实际观察到的东西。
为什么这种不寻常的人类感知标准高于摄影准确性?
该软件将用于驱动绘图机器人,该机器人将与人类艺术家合作(参见:video.google.com/videosearch?q=mr %20squiggle )。
该算法不应将人类所做的不完美的标记视为必然是错误的,而应寻求将画布上已有的内容合并到最终图像中。
因此,相对亮度、色调、饱和度、大小和位置比在照片上与原始照片相同更重要。保持特征的拓扑结构、色块、渐变、凸凹曲线将更重要的是这些特征的确切尺寸形状和颜色
还在我这儿?
我的问题是我有点受“当你有一把锤子时,一切看起来都像钉子”综合症的折磨。对我来说,这样做的方法似乎是使用遗传算法与retrievr使用的小波变换比较(参见:grail.cs.washington.edu/projects/query/)(参见:labs.systemone.at/ retrievr/ )来选择合适的解决方案。
但我认为这是答案的主要原因是这些是我所知道的技术,可能有更优雅的解决方案使用我现在不知道的技术。
考虑人类视觉系统分析图像的方式会特别有趣,因此可能需要特别注意直线、角度、高对比度边界和大块相似颜色。
你对我应该阅读的关于视觉、图像算法、遗传算法或类似项目的内容有什么建议吗?
谢谢
垫
PS。上面的某些拼写对您和您的拼写检查来说可能是错误的。这只是国际拼写变化,可能与您所在国家/地区的标准有所不同:例如澳大利亚标准:颜色与美国标准:颜色