问题标签 [pre-trained-model]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
snapshot - Caffe:从经过训练的快照恢复失败并出现错误
我用一些配置训练了我的网络,然后保存了它的快照。
现在我正在尝试从最后一个快照恢复,但失败并显示以下错误消息:
这就是我试图恢复它的方式:
然后我放弃了,我尝试使用BINARYPROTO
而不是HDF5
,但我收到了这个错误:
当我用不同的模型尝试不同的时间时,历史部分会发生变化(例如 58 vs 28、32 vs 28 和这样,总体错误是相同的,但数字不同!)
我应该怎么办?这让我发疯了!
tensorflow - 是否可以使可训练变量不可训练?
我在范围内创建了一个可训练变量。后来我进入同一个作用域,把作用域设置为reuse_variables
,用来get_variable
检索同一个变量。但是,我无法将变量的可训练属性设置为False
. 我的get_variable
线路是这样的:
但变量'weights'
仍在 的输出中tf.trainable_variables
。
我可以使用设置共享变量的trainable
标志吗?False
get_variable
我想这样做的原因是我试图在我的模型中重用从 VGG 网络预训练的低级过滤器,我想像以前一样构建图表,检索权重变量,并分配 VGG 过滤器值到权重变量,然后在接下来的训练步骤中保持它们不变。
neural-network - 在 TensorFlow 中可视化预训练网络的特征
对于医疗应用,我正在使用TensorFlow重新训练预训练的Inception-v3网络。
该网络有最后一层:
pool_3:0(2048 个特征)
使用 TF 的分类图像,我找出了哪些特征对每个样本最重要。所以有一个数组,其中包含前 N 个特征的索引,按权重排序。
下一步是可视化特征向量以更好地理解结果。
我该怎么做呢?TensorBoard 能做到这一点吗?我有点不知所措。任何建议/帮助表示赞赏!
tensorflow - tensorflow inception 用于使用预训练模型进行再训练/微调:inception_train
我试图在预训练的初始模型之上重新训练(新图像,新类),因此我遵循了初始自述文件的说明: https ://github.com/tensorflow/models/tree/master/inception#how-to -构建一个新的数据集进行再训练
如教程中所述,我使用bazel成功构建并运行了build_image_data 。之后我使用bazel成功构建了inception_train:
但是,运行 bazel-bin/inception/inception_train 我总是得到以下信息:
当然,我会说它有 99.9999% 的机会是错字。于是我尝试用 python 运行 inception_train.py。我不得不更改一些导入位置,最后它使用参数运行。但是,在初始化 CUDA 驱动程序后,脚本会停止并且没有任何错误消息。
任何有关如何解决此问题(或执行微调/重新训练)的帮助将不胜感激。
- 张量流版本:0.9rc0
- CPU : Xeon 5, 24 核
- GPU:网格 K2 8 GB
- 操作系统:Ubuntu 14.04
顺便说一句,我已经将此作为 Github 问题发布(已关闭,因为它更像是 Stack Overflow 的一个案例)。
python - 如何在 Tensorflow 中加载预训练的 LSTM 模型权重
我想在 Tensorflow 中实现一个具有预训练权重的 LSTM 模型。这些权重可能来自 Caffee 或 Torch。
我发现文件中有 LSTM 单元格rnn_cell.py
,例如rnn_cell.BasicLSTMCell
和rnn_cell.MultiRNNCell
。但是我怎样才能为这些 LSTM 单元加载预训练的权重。
python - Tensorflow——迁移学习实现(语义分割)
我正在实现一个 CNN 架构(FCN-8s 模型,带有预训练的 VGG16 模型),用于对我自己的数据进行语义分割(2 类,因此,每个像素的二进制分类)
我打算如何解决这个问题:
- 加载带有权重的预训练模型
- 添加/删除额外的更高层以转换为 FCN
- 冻结预训练模型的较低层(在训练阶段不更新)
- 在特定数据集上训练网络
假设这是正确的,我该如何冻结我的 tensorflow 模型的较低层?(我正在寻找具体的实现细节)我看过 Inception retraining on TensorFlow 教程,但我还不太确定。
这是我想到的工作流程:
通过现有的预训练模型运行我的数据,并提取特征输出,而无需对其进行训练。(如何?)
将这些特征输出输入到另一个包含更高层的网络中 - 并开始对其进行训练。
任何的意见都将会有帮助!
否则,如果我错了,我该怎么想?
更新:
我在下面接受了chasp255的建议,并尝试使用tf.stop_gradient来“冻结”我模型中的较低层。显然,我的实现有问题。可能的替代方案/建议?
该模型是基于 FCN(用于语义分割)论文构建的。我logits
从模型架构中提取,即我的特征,我最初直接将其输入到一个loss
函数中,以使用 softmax 分类器将其最小化。(按像素分类)deconv_1
是我的 logits 张量,形状[batch, h, w, num_classes] = [1, 750, 750, 2]
实现:
然后我运行这些图形操作如下:
因此,当我运行训练周期时,没有优化损失值,这绝对是因为我如何引入tf.stop_gradient
Op.
有关更多详细信息,我的损失函数如下:
tensorflow - 如何在 get_collection 中使用 tensorflow 占位符
所以,我对提要变量有一些问题。我想冻结我的模型在整个时代的权重和偏差。我有下一个变量:
例如,我想在前 10 个 epoch 训练 [wc1, bc1],然后在下一个 epoch 训练 [wc2, bc2],依此类推。为此,我创建了变量集合:
并为集合名称创建占位符:
接下来我尝试在我的优化器中获取它:
饲料数据:
我得到错误:
那么,有什么方法可以在会话中更改训练变量?
谢谢。
caffe - 如何保存预训练的 caffe 模型的子集?
我正在研究具有 3 层的预训练 caffe 模型(在 python 中)。我想分解这个 caffe 模型并创建一个与该模型的第一层相同的新模型。例如:
原始 Caffe 模型数据 -> conv1_1 -> conv1_2 -> conv2_1 -> conv2_2 -> conv3_1 -> conv3_2
新的 Caffe 模型数据 -> conv1_1 -> conv1_2
有谁能够帮助我?
python-2.7 - 预训练的检查点 (.chkpt) 与 GraphDef (.pb)
我正在尝试通过使用预先训练的网络来提取新数据集的特征,例如谷歌在张量流(inception-2015-12-05.tgz)中发布的classify_image_graph_def.pb。我成功了,因为transfer_learning有教程,它使用分类图像图形定义.pb (inception_v3.pb) 来提取新数据集的裂缝。
但是,在新版本的预训练模型中,tensorflow 提供了检查点文件(例如 resnet_v1_152.ckpt)而不是 Graph_def(例如 resnet_v1_152.pb)。我想知道如何使用这些检查点文件来提取像transfer_learning中的特征。谁能给我一些指示?
docker - Tensorflow image_retraining:未找到 docker 中的重新训练
我是 tensorflow 的新手,但我似乎不明白一些东西。
我用 docker 容器( docker run -d -it gcr.io/tensorflow/tensorflow:latest-devel )安装了 TF,它创建了我的容器,里面有张量流。
我现在正在尝试使用 Inceptionv3(https://www.tensorflow.org/versions/r0.9/how_tos/image_retraining/index.html),但 id 不起作用,我找不到“tensorflow/examples/ image_retraining:retrain" 在我的容器中的任何地方
我认为我的安装是问题,所以我启动了一个新的 ubuntu 容器并尝试手动安装张量流、bazel 和所有东西,但它不起作用。
有人知道我如何解决我的问题。
谢谢您的帮助!