问题标签 [image-classification]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
image-processing - 如何为分类任务预处理图像?
我得到了对图像(二进制)进行分类的任务。有包含自行车的图像和不包含自行车的图像。我没有太多数据,所以我正在寻找一个强调图片中自行车特征的选项(过滤器等)。在将特征提供给分类器时,我已经尝试过 laplace 和 canny 过滤器得到相当糟糕的结果。有任何想法吗?
python - 使用 OpenCV 的输入图像错误中的通道数无效
命名空间'::CvtHelper<struct cv::impl::`匿名
命名空间'::Set<3,4,-1>,struct cv::impl::A0xe227985e::Set<1,-1,-1>, struct cv::impl::A0xe227985e::Set<0,2,5>,2>::CvtHelper(const class cv::_InputArray
&,const class cv::_OutputArray &,int) > 输入通道数无效图片:> 'VScn::contains(scn)' > 其中 > 'scn' 为 1
这条线给了我错误
大家好,我是使用opencv的新手,现在我正在做图像分类项目
我的完整代码如下
python - 用于徽标的二进制图像分类器
我目前正在寻找一种可能快速的方法来为图像创建(或使用已经存在的)分类器。主要目标是对图像进行分类,无论它们(主要)是否是徽标。这意味着我对识别公司的品牌/名称不感兴趣。但相反,模型必须说明图像是徽标的可能性有多大。
这样的分类器是否已经存在?如果没有,是否有任何可能的解决方案来避免这项任务的神经网络?
提前致谢。
pytorch - 预期输入 batch_size (18) 与目标 batch_size (6) 匹配
用于图像分类的 RNN 是否仅适用于灰度图像?以下程序适用于灰度图像分类。
如果使用 RGB 图像,我有这个错误:
预期输入 batch_size (18) 与目标 batch_size (6) 匹配
在这条线上loss = criterion(outputs, labels)
。
我的火车、有效和测试数据加载如下。
我的模型如下。
打印图像和输出形状是
错误在哪里?
deep-learning - 事件检测相关问题——计算机视觉
事件检测涉及的步骤。
我对计算机视觉非常陌生,我开始研究事件检测的工作原理。但这真的让我很困惑。我基本上是在创建一个数据集,我从视频中提取帧并用人、汽车、动物等注释帧图像,我想做一个事件检测来查找图像中是否存在崩溃。
我的问题是,在注释时如何包含事件详细信息?我正在使用在线视频注释工具,它只允许注释框架中的对象。
有人可以指导我吗?
另外,我应该按照哪些步骤进行事件检测?
tensorflow - Displaying Images from DataLoader with TensorFlow Lite Model Maker
I am following the tutorial for creating an image classifier using the TensorFlow Lite Model Maker found here: https://www.tensorflow.org/lite/tutorials/model_maker_image_classification#simple_end-to-end_example. Even though I am following the tutorial exactly, I can't images from the loaded data sets to display. Here's the relevant code and error message: error code: AttributeError: 'ImageClassifierDataLoader' object has no attribute 'dataset'
Why is this happening and how do I fix this?
pytorch - 图像分类器模型的输出大小应该是多少?
我正在执行图像分类任务。图像被标记为 0 1 2。模型输出中最后一个线性层的大小应该是 3 还是 1 ?一般来说,对于 3 类操作,输出设置为 3,作为这三个的结果,返回最大概率。但是我看到在某些代码中最后一层设置为1。我认为这实际上是合乎逻辑的。你有什么想法 ?(我也不在最后一层使用 softmax 或 sigmoid 函数。)
python - 我如何将纯文本图像(请愿书、发票、书页)和普通图像(猫、人)分类为两种不同的类型?
我不认为检测图像上的文字确实有效,因为普通图像上也可以有文字(如交通标志)。有没有办法做到这一点?我想不出答案。