问题标签 [computer-vision]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
opengl - 无法在 Ubuntu 8.0.4 中制作 VW34(Oxford Active Vision Lab 库)
我正在尝试制作一个名为 VW34 的非常不起眼的应用程序,它是一个使用 openGL 的计算机视觉库。在大多数应用程序成功编译后,我在 make 过程中遇到错误“GeomObjects/point3d.cpp:88: error: 'VW::Point3D VW::operator+(const VW::Point3D&, const VW::Point3D&)' 应该已在“大众”内部声明”。
据说这个代码可以在我的系统(Ubuntu 8.0.4.2)上干净地编译。所以我可能缺少一些依赖,但我不知道是哪个。我正在使用 gcc-4.1 和 automake1.9(根据自述文件需要)。
以下是我对自述文件创建者使用的同一操作系统的全新安装所遵循的安装说明:http: //people.mech.kuleuven.be/~tdelaet/installation_scenlibEXTRA.txt
以下是 make 连续运行的输出:
这是配置的输出:
这是make的扩展输出:
c - C/C++ 中的鲁棒人脸检测?
我正在寻找一个强大的人脸检测算法/库,最好是用 C 语言(C++ 也可以;如果需要,我可以移植其他语言)。我过去使用过OpenCV的实现,但我不认为它对旋转是不变的。不需要是实时的,但也不应该太慢(也许每张照片一两秒就可以了)。寻求高可靠性,而不是很多误报。有谁知道任何好的实现?
opencv - 使用 Mathematica 的计算机视觉
这里有人在 Mathematica 上做计算机视觉工作吗?我想知道有哪些外部库可用于执行此操作。内置的图像处理功能是不够的。我正在寻找诸如 SURF、立体、相机校准、多视图几何等之类的东西。
将 OpenCV 打包以在 Mathematica 中使用有多难?
image-processing - 人脸识别库
我正在为一个大学项目寻找一个免费的人脸识别库。我不是在寻找人脸检测。我正在寻找真正的认可。这意味着查找包含指定人脸的图像或计算特定人脸之间距离的库。
我目前正在使用OpenCV来检测人脸,并使用粗略的Eigenface算法进行识别。但我认为应该有比自写的特征脸算法性能更好的东西。我不是在谈论速度作为性能,我正在寻找一个比简单的 Eigenface 方法具有更好结果的库。
我看了一下Faint,但似乎该库对于我自己的应用程序不是很可重用。
我对 Python、Java、C++、C 或类似的库感到满意。最好的办法是它可以在 Windows 机器上运行,因为我目前依赖于一些外部的仅限 Windows 的代码。
image - 如何从图像中识别车辆牌照/车牌 (ANPR)?
我有一个允许用户上传汽车图像的网站,我想设置一个隐私过滤器来检测车辆上的牌照并对其进行模糊处理。
模糊不是问题,但是否有库或组件(首选开源)可以帮助在照片中找到许可证?
注意事项;
- 我知道没有什么是完美的,这种类型的图像识别会提供误报和误报。
- 我很感激我们可以要求用户选择要模糊的区域,我们也会这样做,但问题是关于以编程方式查找该数据;因此,诸如“让一个人检查每张图片”之类的答案没有帮助。
- 这种软件方法在英国被称为“自动车牌识别”,但我看不到它作为库的任何实现。
- 尽管首选.Net,但任何语言都很棒。
image-processing - 绘图和绘画机器人的算法 - 任何提示?
绘图和绘画机器人的算法 -
你好
我想编写一个分析图像的软件,然后生成一个图像,该图像捕捉人眼在原始图像中的感知,使用最少的颜色和不透明度变化的贝塞尔路径对象。
与最近的 twitter 超级压缩竞赛(参见:stackoverflow.com/questions/891643/twitter-image-encoding-challenge)不同,我的目标不是创建一个忠实于图像的副本,而是复制人类体验看着图像。
例如,如果原始图像的左上角有一个红色气球,而复制品的左上角有一个看起来像红色气球的东西,那么即使复制品中的气球是位置不完全相同,尺寸或颜色也不完全相同。
当我说“被人类感知”时,我的意思是非常有限的。我不是试图分析图像的含义,我不需要知道图像是什么,我只对人眼会注意到的关键视觉特征感兴趣,只要这可以由算法无法概念化它实际观察到的东西。
为什么这种不寻常的人类感知标准高于摄影准确性?
该软件将用于驱动绘图机器人,该机器人将与人类艺术家合作(参见:video.google.com/videosearch?q=mr %20squiggle )。
该算法不应将人类所做的不完美的标记视为必然是错误的,而应寻求将画布上已有的内容合并到最终图像中。
因此,相对亮度、色调、饱和度、大小和位置比在照片上与原始照片相同更重要。保持特征的拓扑结构、色块、渐变、凸凹曲线将更重要的是这些特征的确切尺寸形状和颜色
还在我这儿?
我的问题是我有点受“当你有一把锤子时,一切看起来都像钉子”综合症的折磨。对我来说,这样做的方法似乎是使用遗传算法与retrievr使用的小波变换比较(参见:grail.cs.washington.edu/projects/query/)(参见:labs.systemone.at/ retrievr/ )来选择合适的解决方案。
但我认为这是答案的主要原因是这些是我所知道的技术,可能有更优雅的解决方案使用我现在不知道的技术。
考虑人类视觉系统分析图像的方式会特别有趣,因此可能需要特别注意直线、角度、高对比度边界和大块相似颜色。
你对我应该阅读的关于视觉、图像算法、遗传算法或类似项目的内容有什么建议吗?
谢谢
垫
PS。上面的某些拼写对您和您的拼写检查来说可能是错误的。这只是国际拼写变化,可能与您所在国家/地区的标准有所不同:例如澳大利亚标准:颜色与美国标准:颜色
c# - 移动端角点检测算法
我正在尝试找到一个很好的算法来检测手机图像中的角落。有多种算法可以做到,我不确定哪一种在内存和处理器受限的环境中表现更好。
具体来说,我试图在使用手机相机拍摄的照片中找到数独网格。我正在使用 C#,找不到任何具有基本图像处理功能的库。我实现了一个 Sobel 滤波器来进行边缘检测,这就是我的立场。
为了清楚起见,问题是有人对使用特定算法或库有什么建议吗?
image-processing - 透视变形矩形的比例
给定一张被透视扭曲的矩形的 2d 图片:
我知道这个形状最初是一个矩形,但我不知道它的原始大小。
如果我知道这张图片中各个角的像素坐标,如何计算出原来的比例,即矩形的商(宽/高)?
(背景:目标是自动去扭曲矩形文档的照片,边缘检测可能会用霍夫变换完成)
更新:
关于是否有可能根据给出的信息确定宽度:高度比,已经进行了一些讨论。我天真的想法是它一定是可能的,因为我想不出办法将例如一个 1:4 的矩形投影到上面描述的四边形上。该比率显然接近 1:1,因此应该有一种数学方法来确定它。然而,除了我的直觉猜测之外,我没有证据证明这一点。
我还没有完全理解下面提出的论点,但我认为必须有一些隐含的假设,即我们在这里遗漏了,并且对此有不同的解释。
但是,经过几个小时的搜索,我终于找到了一些与该问题相关的论文。我正在努力理解那里使用的数学,到目前为止没有成功。特别是第一篇论文似乎准确地讨论了我想要做什么,不幸的是没有代码示例和非常密集的数学。
张正友,何立伟,“白板扫描与图像增强” http://research.microsoft.com/en-us/um/people/zhang/papers/tr03-39.pdf p.11
“由于透视失真,矩形的图像看起来像是一个四边形。但是,由于我们知道它是空间中的矩形,因此我们能够估计相机的焦距和矩形的纵横比。”
ROBERT M. HARALICK “从矩形的透视投影确定相机参数” http://portal.acm.org/citation.cfm?id=87146
“我们展示了如何使用 3D 空间中未知大小和位置的矩形的 2D 透视投影来确定相对于矩形平面的相机视角参数。”
graphics - 最喜欢的手势识别技术
有很多关于手势识别的研究正在进行中。我想我会将其缩小到手势识别的主题(即静止的手部位置,直至像手语识别一样复杂和动态)。
考虑到实时可用的图像处理技术,如斑点检测、边缘检测、兴趣点跟踪等。再加上隐马尔可夫模型和其他比较人工智能,你会用什么技术/算法来做实时运动跟踪和手势识别?