问题标签 [image-classification]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
131 浏览

jpeg - 即使所有图像都是 jpeg 格式,训练 Tensorflow 图像分类模型时也会出错。有人有解决办法吗?

我确保我的数据集包含 jpeg 格式的所有图像。我在某个地方读到了使用tf.image.decode_jpeg(),但即使所有文件都是 jpeg 格式,我仍然需要它。如果是,该怎么做?

0 投票
0 回答
295 浏览

python - 由于警告“无法加载动态库'cudart64_110.dll';....”,导致张量流图像分类教程中的打印消息不正确

我正在关注来自以下链接的 tensorflow 的图像分类教程: https ://www.tensorflow.org/tutorials/images/classification 。

我试过跟随,当我到达线路时

image_count = len(list(data_dir.glob('*/*.jpg')))

print(image_count)

并在我的笔记本电脑上运行它们,打印的数字是 492 而不是 3670。我没有以任何方式修改教程代码。此外,当我运行代码时,在打印数字之前,我收到以下两个警告:

我在网上寻找解决问题的方法无济于事。有谁知道如何解决这个问题?非常感谢您提前。

0 投票
0 回答
550 浏览

deep-learning - 如何在 pytorch 中加载 CUB-200-2011 数据集?

我正在尝试对 CUB-200-2011 数据集进行细粒度的图像分类,但无法找出加载数据的正确方法。我正在使用预训练的 ImageNet ResNet-101 进行训练,方法是冻结除最后两层之外的所有层。建议一种在 Pytorch 中加载数据的方法。

0 投票
1 回答
399 浏览

deep-learning - Pytorch:小批量过拟合:调试

我正在构建一个多类图像分类器。
有一个调试技巧可以对单个批次进行过拟合,以检查程序中是否存在更深层次的错误。
如何以一种可移植的格式来设计代码?
一种艰巨且不明智的方法是为小批量构建一个保留训练/测试文件夹,其中测试类由 2 个分布组成 - 可见数据和不可见数据,如果模型在可见数据上表现更好而在不可见数据上表现不佳,那么我们可以得出结论,我们的网络没有任何更深层次的结构性错误。
但是,这似乎不是一种智能和便携的方式,并且必须解决所有问题。

目前,我有一个数据集类,我在其中以以下方式对 train/dev/test 中的数据进行分区-

PS - 我了解 PyTorch 闪电,并且知道它们具有可以轻松使用的过度拟合功能,但我不想转向 PyTorch 闪电。

0 投票
0 回答
110 浏览

java - 使用反向传播的多层神经网络的准确度在 86% 左右正常吗?

最近,我开始尝试使用反向传播来训练神经网络。网络结构是784-512-10,我用的是Sigmoid激活函数。当我在 MNIST 数据集上测试单层网络时,我得到了大约 90%。这个多层网络我的结果大约是 86%,这正常吗?我是否弄错了反向传播部分?

这是我的代码:

提前致谢!

0 投票
0 回答
18 浏览

neural-network - Caffe 分类测试损失始终为 0,top-1 始终为 -nan

我正在微调一个预训练的 Caffe 模型。出于某种原因,测试迭代总是返回 loss = 0 和 top-1 作为 -nan。loss 和 top-1 的训练迭代值在我看来是合理的。

我预计 top-1 是特定分类的准确度数字,并且始终介于 [0-1] 之间,而损失可能是浮动的。

这是超过 300 次迭代的输出,我每 100 次迭代显示一次结果:

另外,有人可以告诉我Caffe是如何计算损失的吗?这是“总损失”(所有类别的损失总和)还是什么?

0 投票
1 回答
569 浏览

python - 使用 tensorflow 进行多类分类时遇到问题

https://colab.research.google.com/drive/1EdCL6YXCAvKqpEzgX8zCqWv51Yum2PLO?usp=sharing

你好,

上面,我试图用 tensorflow 在牙科 X 射线上识别 5 种不同类型的修复体。我正在使用官方文档来执行这些步骤,但现在我有点卡住了,我需要帮助。这是我的问题:

1-我的数据在我的本地磁盘上。上面链接中的 TF 示例从不同的存储库下载数据。当我想测试我的图像时,除了使用下面的代码之外,我还有其他方法吗?:

我问这个是因为官方文档只是显示了逐个测试图像的方法,如下所示:

2- 我正在使用“image_dataset_from_directory”方法,所以我没有单独的验证目录。那样行吗 ?还是我应该使用 ImageDataGenerator ?为了测试我的数据,我手动从所有 5 个类别中随机挑选了一些数据,并将它们放入我的测试文件夹中,该文件夹有 5 个子文件夹,因为我有那个数量的类别。这是我应该做的预测,还将测试数据分成不同的文件夹吗?如果是,我如何在测试时同时加载所有这 5 个文件夹?

3- 我还应该创建混淆矩阵。但我不明白如何将应用于我的代码?其他人说,使用 scikit-learn 的混淆矩阵,但这次我必须定义 y-true、y_pred 值,我无法将其放入此代码中。我应该为 5 个不同的预测评估 5 个不同的混淆矩阵吗?如何?

4- 有时,我观察到验证准确度开始远高于训练准确度。这不寻常吗?在 3-4 个 epoch 之后,训练准确度会超过验证准确度,并以更平衡的方式继续。我认为这不应该发生。一切还好吗 ?

5- 最后一个问题,为什么第一个 epoch 比其他 epoch 需要更长的时间?在我的设置中,完成第一个 epoch 大约需要 30-40 分钟,然后每隔一个 epoch 只需大约一分钟左右。有没有办法解决它或者它总是以同样的方式发生?

谢谢。

0 投票
1 回答
37 浏览

python - 使用张量流迁移学习模型预测单个图像文件

我是图像分类的新手,如果这个问题看起来太天真,我很抱歉。我正在为我最近的工作使用 tf 迁移学习模型。参考:https ://www.tensorflow.org/tutorials/images/transfer_learning 。

这里清楚地提到了如何使用这个模型来预测图像的批量预测。但是我很难弄清楚如何使用它对单个图像进行预测。

我试过这个:

但这对所有图像都给出了 1 作为结果。我想要使​​用此模型在图像级别进行概率预测。

0 投票
1 回答
81 浏览

r - 如何使用 EBImage 将灰度图像列表转换为 RGB 图像

我有一个灰度图像列表。它们通过 EBimage 存储在 R 中,代码如下:

它们存储为具有以下属性的图像:

如何将所有这些图像转换为 rgb,或者至少给它们提供尺寸 [x,y,3]?我做了一个 for 循环, channel(Normaltrainingpics[[i]],'rgb') 但尺寸保持不变。谢谢。

https://rdrr.io/bioc/EBImage/man/channel.html 根据此资源:“rgb”将灰度图像或数组转换为彩色图像,复制 RGB 通道。

0 投票
2 回答
753 浏览

python - 我是否使用“rescale=1./255”?构建VGG-like CNN

我正在构建一个与 VGG16 具有相似架构的 CNN。我知道在 VGG16 中你确实重新调整了你也以 0 为中心。现在我从头开始训练我的,这有什么不同吗?我应该这样做还是不这样做?有谁能帮忙吗?

datagen = ImageDataGenerator(rescale=1. / 255)

非常感谢你们!<3