问题标签 [vision]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
5 回答
164 浏览

product - 软件开发应该与软件设计和可用性分开吗?

在我迄今为止从事的大多数商业工作中,我的角色主要局限于“编写代码”,而我最初想从事开发的原因是因为我喜欢软件的可用性和设计方面。

我现在感到有点失望,因为现在,我几乎所有的工作日都花在“把东西放在一起”上。这似乎是可以想象的最平凡的工作,如果人们认为我们有能力,程序员在某些行业中往往会受到轻视也就不足为奇了。

回答我的问题 - 是否有适合想要进行创意控制的开发人员的工作?对于那些不仅仅是代码猴子,而是想要构建一个漂亮的产品并大量参与的开发人员,不仅仅是在代码中,而是在产品的整个设计和愿景中?

0 投票
5 回答
846 浏览

requirements - 通过业务需求定义愿景

如何为某些业务编写[一般]愿景?它有一些模板吗?有什么例子吗?关于在线票务服务的业务。

0 投票
2 回答
2250 浏览

vision - 如何使用立体视觉对室内环境进行准确的 3D 重建?

我在 openCV 中使用 cvStereoFindCorrespondenceGC() 从著名的 tsukaba 图像中生成视差图。但我注意到它缺少 3D 功能(例如,灯是平的而不是略微弯曲的)。如何解决这个问题?目前的算法缺少什么?

0 投票
2 回答
2657 浏览

c++ - 高维空间中的 OpenCV 1.1 K-Means 聚类

我正在尝试编写一袋特征系统图像识别系统。该算法的一个步骤是获取大量的小图像块(例如 7x7 或 11x11 像素),并尝试将它们聚集成看起来相似的组。我从图像中获取我的补丁,将它们转换为灰度浮点图像补丁,然后尝试让 cvKMeans2 为我聚类它们。我认为我在格式化输入数据时遇到问题,以便 KMeans2 返回一致的结果。我之前使用 KMeans 进行 2D 和 3D 聚类,但 49D 聚类似乎是另一种野兽。

我不断获取返回的集群向量的垃圾值,所以显然这是一个垃圾输入/垃圾输出类型的问题。此外,对于如此庞大的数据集,该算法的运行速度比我认为的要快得多。

在下面的代码中,直接 memcpy 只是我最近一次尝试以正确格式获取输入数据,我花了一段时间使用内置的 OpenCV 函数,但是当您的基本类型是 CV_32FC(49) 时,这很困难。

OpenCV 1.1 的 KMeans 算法能否支持这种高维分析?

有人知道从图像复制到 K-Means 输入矩阵的正确方法吗?

有人可以指出我可以使用的免费非 GPL KMeans 算法吗?

这不是最好的代码,因为我现在只是想让事情正常工作:

提前致谢!

0 投票
3 回答
2819 浏览

image - OpenCV:在图像上绘图

我正在使用 OpenCV 库开发一个程序(尽管我对它很陌生)。我需要做的一件事是在图像上绘图。我查看了 OpenCV 绘图函数,它们看起来都很简单(圆、线等),但是程序无法编译!准确地说是:错误 C3861:“行”:找不到标识符。有什么我没有安装吗?我使用http://opencv.willowgarage.com/wiki/VisualC%2B%2B_VS2008上的教程在 Visual Studio 2008 上安装 OpenCV,到目前为止,这是我唯一真正遇到的问题。请帮我!我需要这个程序尽快运行!

0 投票
2 回答
1922 浏览

opencv - 尝试使用 OpenCV 捕获显示输出以进行实时分析;我需要与操作系统交互以进行输入的帮助

我想将 OpenCV 计算机视觉库中的操作实时应用于从我的计算机显示器捕获的视频。这种特殊情况的想法是在流行游戏的游戏过程中检测有趣的特征,并为用户提供增强的体验;但我可以想到其他几种情况,人们也希望能够实时访问这些数据。无论如何,对于开发阶段,使用预制视频可能是可以接受的,但对于最终应用程序的性能和响应能力显然是至关重要的。

到目前为止,我正在尝试在 Ubuntu 10.10 上执行此操作,并且更喜欢使用类似 UNIX 的系统,但任何选项都值得关注。我的 C 技能非常有限,所以每当可以通过 Python 与 OpenCV 交谈时,我都会尝试使用它。请注意,我不是从相机设备中捕获,而是从显示输出的实时流中捕获;我不知道如何接受输入。据我所知,CaptureFromCAM 仅适用于相机设备,在我看来,最终结果对实时性能的要求使得存储在文件中并通过 CaptureFromFile 读取是一个糟糕的选择。

到目前为止,我发现的最有希望的路线似乎是使用带有 x11grab 选项的 ffmpeg 从 X11 显示器捕获;(例如,命令 ffmpeg -f x11grab -sameq -r 25 -s wxga -i :0.0 out.mpg 将显示 0 的 1366x768 捕获到“out.mpg”)。我想应该可以将 ffmpeg 的输出流视为 OpenCV 读取的文件(可能是通过使用 CaptureFromFile 函数),也许可以使用管道;但这一切都比我以前处理过的要高得多,我真的可以使用一些方向。您认为这种方法可行吗?更重要的是,你能想到一个更好的吗?你会怎么做?

0 投票
2 回答
259 浏览

language-agnostic - 如果 3d 视图的左右图像倒置,您会看到什么?

对不起,也许是微不足道的帖子,但我真的无法弄清楚......

假设您有一些 3d 眼镜或可以让您获得 3d 立体视觉的东西。

如果你反转左右图像会发生什么???仔细想想,我真的想不通。你应该看到图像的反面吗?还是只是一些轴偏移?

不幸的是,我无法以任何方式尝试它,但即使可能,我也很想在尝试之前先用自己的想法弄清楚并理解这件事

所以,欢迎任何帮助,任何想法,任何可以帮助我理解或深入讨论的打击。

0 投票
2 回答
418 浏览

image - 从图像中获取点

我想从给定的图像中提取点。图像如下所示.. 在此处输入图像描述

我想要的点是绿色的上点和红色的点。我尝试逐像素比较,但它太慢了。我需要一个更好的算法。你有什么建议?

0 投票
1 回答
318 浏览

php - 有机形状检测和测量(PHP、JS ...或其他)

图片:

http://img511.imageshack.us/i/measuring1and2space.gif/

我们有一个 .gif 图片。我们要测量 3 个黑色岛屿 (2) 相对于白色大“海洋” (1) 的大小。(3) 是背景——我们必须将其视为 (1) 的边界,但我们不想测量它。(0) 是选择的主要区域(在本例中为 (1)),应用作测量的参考区域。所以在这种情况下 (0) 在 (1) 中,因此它本身是 100%(参考)。所以这三个岛的大小约为(0)的 xx%。如果 (0) 在 (2) 中,则 (1) 是岛的 Xxx%。

好的......让我们说:

1)用户在(1)中取(0)。让我们想象他正在使用 JS,然后将红点拖放到白色区域。红点检测其下方区域的颜色。

2)现在系统需要检测整个白色区域,将其设置为(0)并给它100%。系统必须区分 (2) 和 (3)。因此可以测量(2)和(1)的大小之间的关系。


我无法想象这种算法在 PHP 中是如何实现的。这会很棒,但我认为……如果可能的话……像 OpenCV 之类的东西是更好的解决方案。不幸的是,我没有这方面的经验。我尝试在 PHP 中编写一些 CV,如果有几何形状是可行的,但这些是有机的。

你能给我一些方向吗?我不知道该去哪里。:(

提前致谢。:)

0 投票
5 回答
12629 浏览

iphone - iPhone 上的数字识别是否可以实时进行?

我需要从 iPhone 上的相机图像中实时识别数字。我知道图像上的数字不会超过 5 位。

考虑到 iPhone 的计算规格,这个问题是否真的可以解决?有没有人有使用 Tesseract OCR 库的经验,你认为可以通过使用它来解决吗?