问题标签 [object-recognition]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
image-processing - 我从哪里开始学习图像处理和对象识别?
我有兴趣编写一些基本的计算机化对象识别应用程序,因此我认为我需要一些图像处理算法的理论背景,以及一些用于决策能力的 AI。
我是一名计算机科学专业的毕业生,有一天我计划获得硕士学位,希望在这些领域之一。同时,我想抢先一步,做一些自学。
所以我的问题是,我从哪里开始?如果可能的话,我会很感激一个正确方向的箭头,一些链接。
object-recognition - 物体识别的最佳工具
我想做一个关于物体识别的小项目,关于这个主题有什么工具或文献建议吗?
image-processing - 图像分类:从图像中识别许多建筑物的各种特征
所以,假设我有许多建筑物的经度/纬度或地址
我可以获得卫星图像、“街景”,也许还有建筑物的 3d/透视图。
我想找到:
高度、楼层数、建筑面积(最大建筑占地面积)
的建筑物。大约 20 万座建筑物。
是否有从卫星照片或图片中识别建筑物的库?我想有点像人脸检测。
还有其他建议吗?
谢谢!
php - 识别图像 JPG 或 PNG 的模式
你好朋友我想用php识别和确定物体的类型到照片jpg或png中,例如确定是否存在苹果或葡萄,或汽车,或任何照片中的动物。请如果有人知道这一点,因为我想做到这一点。
问候吉尔杜斯
android - 安卓增强现实帮助
我只需要一些关于如何检测标记并制作输出文本的指南..例如:带有狗图像的标记,当检测到时,我在文本字段中有一个输出文本“DOG”..有人可以帮我吗我的想法?哦,顺便说一句,对于我的想法,使用 nyartoolkit 或 andar 哪个更有效?谢谢:) 需要帮助..!
opencv - 在实际项目开发之前,用于特征检测(SIFT 等)原型的 OpenCV 的 GUI 版本?
我有一个想法,我需要能够从渲染的 3D 数字电影中识别某些对象或模型。
经过有限的研究,我现在知道我需要的是计算机视觉领域的特征检测。
所以,我想做的是:
- 创建电影中某个角色的一些屏幕截图(例如,前/后/左/右)
- 播放电影
- 在播放电影时,不断创建电影的新截图
- 对于每个屏幕截图,执行特征检测(SIFT?,使用 openCV?)以查看是否存在我们的任何角色外观(如果角色距离较远并因此显得更小,或者角色是否在撒谎,则它们仍然必须被识别下)。
- 发现角色时发出通知
这可以通过 OpenCV 实现,对吧?
“问题”是我必须学习 c++ 或 python 来开发这个应用程序。如果我的电影和屏幕截图适用于我想做的事情,这不是问题。
所以,我想先测试一下我的电影截图。是否有一个 GUI 版本的 OpenCV,我可以输入我的测试数据,然后手动执行它的特征检测算法作为原型设计的一种手段?
任何反馈表示赞赏。谢谢。
algorithm - 计算机视觉:考虑颜色的 SURF(加速鲁棒功能)
是否可以增强 Speeded Up Robust Features (SURF) 计算机视觉算法,使其能够区分具有不同颜色的均匀分布和形状的物体?
我正在寻找研究论文或任何其他试图增强 SURF 的资源,以便它可以区分具有不同颜色的相同对象。
opencv - 特定平面物体的物体检测
我是计算机视觉的新手,我想检测图像(或视频帧)中的特定和平面对象。
我所说的具体和平坦是什么意思?
平坦的
好吧,扁平物体就像物体,但是,你知道的,扁平的……这对我意味着什么:
- 物体将始终从大致相同的“正面”角度观察,即相机的轴(或多或少)与其表面法线相对应。(但它们可能围绕该轴旋转)。
- 照明角度不会改变任何东西的对象(即它没有投射阴影的凹凸和折痕)。
具体的
- 我知道其确切外观和形状的物品。它们都完全相同,没有变化。
- 我有一张他们的(精确的)照片(或代表)。
此类对象的示例
- 1美元钞票的正面
- 蒙娜丽莎
- (你最喜欢的杂志在这里)上一期的封面
- ...
我相信这个问题很简单,我应该能够找到一个基本上像这样工作的计算机视觉库的函数:
事实上,我什至并不真正关心对象的大小和位置,我只需要计数。
但我找不到这样的东西。我能找到的只有无数的人脸识别示例,这些示例使用称为 Haar 分类器的东西,这似乎根本不适合我的问题,因为:
- 人脸不是平面的,因此分类器必须处理不同的照明、阴影等问题......
- 它必须识别人脸,即相似但不完全相同的对象。
- 它必须识别那些没有被训练过的面孔,因为它们“看起来像”面孔。
- 证明这不合适:它必须用成百上千的正负样本进行训练。在我的问题中,所需的所有信息都包含在一个样本中。所以这不可能。
那么,这样的事情存在吗?
我更喜欢使用 OpenCV,因为这似乎是标准的计算机视觉库,但我愿意接受任何解决方案。
computer-vision - 是什么让对象表示和识别变得困难?
直观地说,从几乎任何物体的不同角度给出十几个左右的 2d 图像,似乎应该很容易构建该物体的 3d 表示。随后,以这种方式获得的 3d 表示库可用于识别新的 2d 图像。
沿着这些思路有哪些文献,为什么它还没有产生强大的对象识别?
probability - 使用图像识别确定对象身份
我编写了一些图像分析软件,可以确定它认为是图像中最主要对象的基本形状、颜色和尺寸。
我还创建了一个对象数据库供算法选择:
例如,系统检测到一个宽 42 厘米、高 26 厘米的黑色矩形。在这种情况下,“box”和“backpack”都可以作为正确答案。有没有什么好的方法可以对这两种物品中的哪一种做出有根据的猜测,例如 75% 的可能性是背包,25% 的可能性是盒子(可能是基于盒子有可能是 3不同的颜色和更广泛的尺寸范围,而不是只能是黑色的背包)?
也欢迎其他建议。我必须自学图像识别,所以如果我应该尝试从图像中提取其他东西,或者我应该以不同的方式处理数据库,这些评论也将不胜感激!