问题标签 [image-classification]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
80 浏览

python - 二元分类问题的低准确率

我正在尝试建立一个分类模型来识别室内设计中图片的观点。目前,我只考虑两个类:sofa_left 和 sofa_right,具体取决于沙发的方向(参见示例)

我使用与本教程相同的代码进行迁移学习(基于具有 imagenet 权重的 MobileNetV2)。

代码没有问题:我可以使用提供的猫狗数据集重现预期结果。

如果有帮助,这里是模型摘要。

然而,我自己的图像的结果真的很差(50% 的准确度......),我不知道为什么。模型中有 dropouts,我尝试了很多设置(学习率、验证拆分、批量大小)和很多预训练模型。

每个班级我有大约 150 张照片。我知道这不是一个很大的数据集,但我不需要过多概括,我需要测试的所有图片都是同一类型的。是不是太短了?

kmeans clustering对数据集上的 MobileNetV2 进行的预测运行了一个算法,tada...图片在 sofa_left 和 sofa_right 之间完美排序。它让我直觉这个分类问题应该可以通过学习来解决。我对吗?我错过了什么吗?

谢谢您的帮助。

0 投票
1 回答
15 浏览

tensorflow - Tensorflow TPU 数据转换器工具示例中的 image_utils 来自哪里?

我正在尝试转换图像分类数据集以与 Cloud TPU 一起使用(如此处所示,在他们提供的示例中,有这个文件(https://github.com/tensorflow/tpu/blob/master/tools /data_converter/image_classification/image_classification_data.py)。第 44 行有这个导入:

我找不到这个 image_utils 来自哪里。非常感谢帮助。

0 投票
1 回答
125 浏览

python - 预测标签已关闭 - KERAS / Tensorflow

我正在使用 KERAS/TF 制作一个带有迁移学习的图像分类器,包括预训练的模型权重。图像数据集按 80/10/10 拆分。类别是范围从 1 到 80 的字符串标签。

对于图像的预处理,我使用 ImageDataGenerator 并且评估在评估集上显示出良好的准确度,约为 58%。但是,尝试预测评估集上的值给出了大约 0.01 的准确度。我也在测试集上试过了,结果还是不行。

有人知道预测出了什么问题吗?

先感谢您!

此致,

0 投票
1 回答
108 浏览

deep-learning - PyTotch CIFAR-10 vs Kaggle CIFAR-10:CIFAR-10 上完全相同架构的完全不同的结果

我已经学习 PyTorch 几个星期了。当我使用PyTorch datasets 中的 CIFAR-10 数据集进行练习时,我也想到了使用 ImageFolder 类进行练习,因此我从 Kaggle 中找到了 Cifar-10的一个版本,其中图像被文件夹。(我你不记得 PyTorch 数据集是tar.gz 格式,而不是文件夹结构)

令我大吃一惊的是,尽管使用相同的损失函数、学习率和架构,Kaggle 数据集测试集的准确度从 0.18 开始,PyTorch 数据集的准确度从 0.56 在 epoch 1 开始。

最终在 20 个 epoch 之后,一个几乎在 0.45 附近饱和,而后一个几乎固定在 0.86 附近。

我一次又一次地检查,但没有发现这两个代码有什么大的区别。我真的很想知道,如果我做错了什么,或者这两个数据集有什么根本不同。

澄清一下,我正在使用这个Pytorch 数据集和这个Kaggle 数据集。代码太大,这里不提供,所以我提供了我的笔记本,欢迎你看我的整个代码,如果需要也可以运行[你只需要使用你的 Kaggle API 密钥来下载来自 kaggle 的数据集,我不能公开我的数据集...抱歉给您带来不便] Kaggle Dataset Notebook herePytorch Dataset Notebook here

我还提供了我认为大部分不同的代码块。

Kaggle 数据集:

Epoch 1 得分 = 0.18 Epoch 20 得分 = 0.45

Pytorch 数据集:

Epoch 1 得分 = 0.18 Epoch 20 得分 = 0.45

0 投票
1 回答
21 浏览

tensorflow - 如何解读 AI Platform 内置分类算法中的 image_size 参数?

我正在关注 Google AI Platform 的“开始使用内置图像分类算法”教程,在提交训练作业之前,必须指定(似乎是可选的)“image_size”,定义为:“图像用于训练的尺寸(宽度和高度)”。我是否必须指定几个标量(逗号分隔?)或一个标量?我们如何解释这个参数?如果我指定了一些东西,它是否强制我所有的输入图像都应该是这个特定的大小,或者图像会被训练图自动调整大小(或裁剪?)到这个大小?同样对于预测任务,我是否必须将输入图像的大小调整为这个特定的大小,或者预测图是否会处理这个问题。

0 投票
1 回答
770 浏览

python - 将频谱图保存为图像而不替换它。谷歌合作实验室

我有大约 5000 个音频样本,并为每个样本制作了频谱图并保存为图像。我已经知道如何用 librosa 制作频谱图,显示它并保存在正确的图像中。但是每次在保存图像之前都会感到沮丧。使用所有 5000 个样本进行此操作不是一个好主意。是否可以在不替换的情况下保存图像?

0 投票
1 回答
28 浏览

python - 有人可以帮我解决这个输入错误吗?

我正在训练 3D CNN 进行图像分类,但是我收到以下错误,我将 tensorflow 作为后端。运行 model.fit() 时,我不断收到此错误。

我查看了网上发布的大部分相关问题,但它们都集中在后端是 theaon 还是 tensorflow。其中一些建议扩展尺寸,但仍然不起作用,并且出现了其他一些问题。

我的模型

我得到的错误:


0 投票
0 回答
137 浏览

python - ValueError: 层dense_2的输入0与层不兼容

我试图使用我训练的模型来检查传递给它的图像,但是,它未能使用我传递的图像。

编码:

我试图运行代码来检测图像的预测,我得到了这个错误:

我在 Google Colabs 中使用了相同的图像和模型,它在那里工作,但是在我的本地计算机上运行它时,它的工作方式不一样,我该如何解决这个问题?

0 投票
1 回答
338 浏览

opencv - OpenCV中absdiff和正常减法之间的区别

我目前正计划训练一个二值图像分类模型。我要训练的图像是两张原始图片之间的差异。换句话说,对于每个数据条目,我从 2 张图片开始,取它们的差异,并将差异标记为 0 或 1。我的问题是找到这种差异的最佳方法是什么。我知道cv2.absdiff然后正常减去图像 - 最有效的方法是什么?

关于数据:我正在训练的图像是屏幕截图,通常相同,但可能存在细微差异。我发现正常减法似乎显示的差异小于 absdiff。

这是我用于 absdiff 的代码:

然后这是正常的减法:

谢谢!

0 投票
0 回答
44 浏览

python - ValueError:标签不在输入中。对于没有标签的预测示例,请改用基本模型

我正在尝试预测图像的标签,但我得到了 ValueError。我的代码是

我应该怎么办?