问题标签 [tf-slim]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 使用 Tensorflow Slim 从头开始训练 ResNetv1
虽然在slim 模型中说明 train_image_classifier.py 可用于从头开始训练模型,但在实践中我发现很难。就我而言,我试图在一台 6xK80 的本地机器上从头开始训练 ResNet。我用这个:
我遵循了与论文中建议的相同设置。我在本地机器上使用 8 个 GPU,batch_size 为 32,因此有效的批处理大小为 32x8=256。学习率最初设置为 0.1,每 30 个 epoch 衰减 10 个。经过 70K 步(70000x256/1.2e6 ~ 15 epochs)后,验证集的 top-1 性能低至 ~14%,而经过这么多次迭代后它应该在 50% 左右。我使用这个命令来获得 top-1 性能:
由于缺乏工作示例,很难说是否存在苗条训练代码中的错误或我的脚本中的问题。我的脚本有什么问题吗?有没有人成功地从头开始训练怨恨?
computer-vision - tensorflow-slim 中 ResNet-50 中的图像居中
我在 tensorflow-slim 中使用 ResNet-50 模型来提取特征。我的问题是,在输入图像之前,我是否需要根据一些标准的 ResNets-50 平均值将图像居中?我知道对于 vgg-19 tf-slim 提供了使用中
_mean_image_subtraction(image, means)
定义的居中选项vgg_preprocessing.py
。但我找不到 ResNets 的任何此类文件或函数。
python-2.7 - tensorflow slim 并发训练和评估循环;单个设备
我有兴趣使用 tensorflow slim 库 (tf.contrib.slim) 在训练期间定期评估 (n) (整个) 测试集上的模型性能。文档很清楚 slim.evaluation.evaluation_loop 是要走的路,而且看起来很有希望。问题是我没有第二个 gpu 可用,这个模型参数占用了整个 gpu 的内存,我想做并发评估。
例如,如果我有 2 个 GPU,我可以在第一个 gpu 上运行一个以“slim.learning.train()”终止的 Python 脚本,在第二个 gpu 上运行另一个以“slim.evaluation.evaluation_loop()”终止的 Python 脚本.
有没有一种方法可以为这两个任务管理 1 个 gpu 的资源?tf.train.Supervisor 浮现在脑海中,但我真的不知道。
tensorflow - 分布式张量流澄清
我的理解是否正确,model_deploy
允许用户在一台机器上使用多个设备训练模型?基本前提似乎是克隆设备进行变量共享,并且变量以循环方式分发到参数服务器。
另一方面,分布式张量流框架使用户能够通过集群训练模型。集群允许用户使用跨多个服务器的多个设备训练模型。
我认为 Slim 文档非常精简,并且已经多次提出了这一点: 跨多个 GPU/机器的 TF-Slim 的配置/标志
谢谢你。
tensorflow - slim.metrics.streaming_sparse_average_precision_at_k 的含义是什么?
这个函数参考了tf.contrib.metrics.streaming_sparse_average_precision_at_k,源码中的解释如下,有谁可以通过简单的例子来解释一下吗?我想知道这个指标是否与 PASCAL VOC 2012 挑战赛中使用的平均精度计算相同。非常感谢。
python - TF Slim 和初始预测概率
我已经使用 tf slim (v1.3) 训练了 inception v4 的最后一层,我正在尝试将处理集成到现有工具中,但我无法弄清楚如何生成预测。我想要所有的预测值,而不仅仅是 argmax。我有一个检查点路径和一些带有图像的 numpy 数组(100x100x3,这是我训练的……但扩展到 299x299x3)。有人可以指出我正确的方向吗?我将提供多张图像进行评估,但不一定是批量提供(我可能会运行一个微服务,它获取一张或多张图像并返回结果,但只加载一次检查点以缩短初始化时间)。
github - Github tf - slim 预训练模型动物园在哪里?页面返回 404
下载许多用于 tensorflow slim 的预训练模型权重的众所周知的地方是此页面https://github.com/tensorflow/models/tree/master/slim。这个页面也被很多链接引用(现在都无效)。我记得几天前我访问了这个页面,一切都很好,但现在它只是停止工作(github返回404)。如果它被移动到其他地方或完全删除,任何人都可以告诉我。或者,有人可以建议我一个下载经典 CNN 预训练权重的地方,用于 tensorflow 或 tf-slim。任何帮助,将不胜感激。
image-processing - 使用 TF-Slim 在我自己的数据上微调预训练的 VGG16 模型
我正在尝试使用 TF-Slim 微调 VGG-16 预训练模型,但是,我在开始时遇到了麻烦(当尝试预处理数据时,即将图像从 tiff 转换为 jpeg,然后转换为 tfrecord 格式)。
任何人都可以建议使用最佳方法来微调模型以适应这些图像吗?
或者也许将我指向如何执行此操作的分步指南?道歉,因为我是 convnets 的新手,我正在尝试弄清楚如何开始微调。
提前致谢。
tensorflow - 为什么通常使用“slim = tf.contrib.slim”而不是 import slim?
在大多数 tensorflow slim 教程中,slim 模块是使用加载的,
如果我这样做,它似乎没有任何区别(我错过了什么吗?)
我们有什么特别的原因要使用“slim = tf.contrib.slim”而不是“import”吗?