问题标签 [vision]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
3290 浏览

image-processing - 如何识别图像中的字母?(在 OCR 之前)

我在网上只能找到关于 OCR 的信息,但我还没有,我仍然需要识别图像中字母的位置。

任何帮助将不胜感激

0 投票
1 回答
269 浏览

webcam - 在一组监控摄像头图像中查找重要图像

我在屋外遇到了盗窃问题,所以我设置了一个简单的网络摄像头,用 Dorgem (http://dorgem.sf.net) 捕捉每一秒。

Dorgem 确实提供了一项功能,即使用运动检测仅捕获屏幕上正在移动的帧。问题是它使用的运动检测算法非常敏感。由于我廉价的网络摄像头连续拍摄之间的颜色变化,它会熄灭,而且它也会因为房子前面的树在风中飘扬而熄灭。此外,我家门前是人流量大的区域,因此也有大量合法捕获的帧。

我使用 Dorgem 的运动检测平均每秒捕获 2800/3600 帧。这对我来说太多了,无法搜索以找出有趣的活动在哪里。

我希望我可以将相机重新定位到一个更理想的位置,它只会捕捉我感兴趣的区域,这样运动检测会更简单,但这对我来说不是一个选择。

我认为,因为我的相机有一个固定的位置,并且每张照片都在我家门前的同一区域框住,所以我应该能够扫描图像并找出哪些图像在该图像的某个有趣区域有运动,把所有的都扔掉其他框架。

例如:如果像素 320,240 发生变化,那么有人走到我家门前,我想看到那个框架,但是如果像素 1,1 发生变化,那么它只是随风飘扬的树木,框架可以被丢弃。

我看过 pdiff,一个在图片集中查找差异的工具,但它似乎也专注于区分整个图片,而不是它的特定区域:http: //pdiff.sourceforge.net/

我还查看了 phash,这是一种基于人类对图像的感知计算散列的工具,但它似乎太复杂了: http ://www.phash.org/

我想我可以在 shell 脚本中使用 imagemagick 的 mogrify -crop 来实现它来挑选我感兴趣的图像区域,然后运行 ​​pdiff 来找到有趣的区域,并使用它来挑选出有趣的帧。

有什么想法吗?想法?现有工具?

0 投票
3 回答
401 浏览

networking - 云上的计算机视觉

有什么方法可以在云上进行计算机视觉吗?这个想法就像人们登录一个网站,然后激活网络摄像头,将视频数据通过互联网发送到服务器。服务器处理这些数据并将处理后的数据实时或至少每秒 10 帧发送回用户。

这是可行的吗?我们在网络端需要什么样的技能?我知道视频流是其中一个组成部分。另外,我们如何设置服务器?分布式系统是否可以在有限的时间内考虑非常大的计算?

0 投票
3 回答
2080 浏览

ocr - 光学字符识别

大家好,我正在尝试用 Java 创建一个程序,它可以读取屏幕上的数字,也可以识别屏幕上的图像。我想知道我怎么能做到这一点?数字的字体将始终相同。我以前从未编写过这样的程序,但我对它的工作原理的想法是让程序截取屏幕截图,然后将数字图像与屏幕截图图像的部分重叠并检查它们是否匹配,对每个数字重复此操作. 如果这是执行此操作的正确方法,我将如何将其放入代码中。

提前感谢您的帮助。

0 投票
1 回答
915 浏览

android - 安卓人脸识别

我尝试使用修改后的 Crystax NDK 设置 OpenCV,但没有成功(我设法使用 CygWin 进行编译,但不知道从那里去哪里。)我可以使用更简单的类库来执行简单的人脸识别例程吗?我需要做的就是找出面孔并进行比较。提前致谢

0 投票
7 回答
2499 浏览

computer-vision - 计算机视觉数据集

我正在测试用于图像分类的计算机视觉算法。我想找到一个包含几类对象的数据集,例如猫和狗。该数据集应具有每个类别内的所有可变性,这是由于该类别的内在可变性。也就是说,我不想担心从不同视点或在不同照明条件下拍摄的照片等。几乎所有类别内的可变性都应归因于该类别的内在可变性,例如猫的类别将包含许多不同的图像是因为猫实际上看起来彼此不同,而不是因为这些图像是在不同的条件下产生的。

优选地,对象将被“切掉”(在统一的背景上)。数据集的大小并不重要。合成图像(可能使用 3D 图形软件生成)也可以。图像需要标有它们的类别。

有谁知道这样的数据集?

0 投票
1 回答
11408 浏览

algorithm - 双边过滤器

给定高斯滤波器,如何实现双边滤波器?

0 投票
1 回答
311 浏览

wpf - VC++ 和 openCV 代码的最佳接口

我有 win32 C++ 代码和 openCV ,我想设计该代码的接口。

它的最佳实施是什么?

我想使用 WPF,但更多网站说 VC++ 和 openCV 不支持它

云你帮帮我?

提前致谢。

0 投票
2 回答
1958 浏览

android - Android中的光流

我们已经与 OpenCV 打交道两周以使其在 Android 上运行。你知道我们在哪里可以找到光流的 Android 实现吗?如果它是使用 OpenCV 实现的,那就太好了。

0 投票
1 回答
178 浏览

vision - 如何启用 Layar Vision?

我是 Layar 开发的新手。我想报名参加 Layar Vision 挑战,但我无法为我的图层启用 Layar vision。在此帮助页面上,启用图层视觉的过程定义为:

但是我无法弄清楚如何做到这一点。请问有人可以帮我吗?