问题标签 [pre-trained-model]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1533 浏览

snapshot - Caffe:从经过训练的快照恢复失败并出现错误

我用一些配置训练了我的网络,然后保存了它的快照。
现在我正在尝试从最后一个快照恢复,但失败并显示以下错误消息:

这就是我试图恢复它的方式:

然后我放弃了,我尝试使用BINARYPROTO而不是HDF5,但我收到了这个错误:

当我用不同的模型尝试不同的时间时,历史部分会发生变化(例如 58 vs 28、32 vs 28 和这样,总体错误是相同的,但数字不同!)

我应该怎么办?这让我发疯了!

0 投票
4 回答
31184 浏览

tensorflow - 是否可以使可训练变量不可训练?

我在范围内创建了一个可训练变量。后来我进入同一个作用域,把作用域设置为reuse_variables,用来get_variable检索同一个变量。但是,我无法将变量的可训练属性设置为False. 我的get_variable线路是这样的:

但变量'weights'仍在 的输出中tf.trainable_variables

我可以使用设置共享变量的trainable标志吗?Falseget_variable

我想这样做的原因是我试图在我的模型中重用从 VGG 网络预训练的低级过滤器,我想像以前一样构建图表,检索权重变量,并分配 VGG 过滤器值到权重变量,然后在接下来的训练步骤中保持它们不变。

0 投票
1 回答
1377 浏览

neural-network - 在 TensorFlow 中可视化预训练网络的特征

对于医疗应用,我正在使用TensorFlow重新训练预训练的Inception-v3网络。

该网络有最后一层:

pool_3:0(2048 个特征)

使用 TF 的分类图像,我找出了哪些特征对每个样本最重要。所以有一个数组,其中包含前 N 个特征的索引,按权重排序。

下一步是可视化特征向量以更好地理解结果。

我该怎么做呢?TensorBoard 能做到这一点吗?我有点不知所措。任何建议/帮助表示赞赏!

0 投票
0 回答
899 浏览

tensorflow - tensorflow inception 用于使用预训练模型进行再训练/微调:inception_train

我试图在预训练的初始模型之上重新训练(新图像,新类),因此我遵循了初始自述文件的说明: https ://github.com/tensorflow/models/tree/master/inception#how-to -构建一个新的数据集进行再训练

如教程中所述,我使用bazel成功构建并运行了build_image_data 。之后我使用bazel成功构建了inception_train

但是,运行 bazel-bin/inception/inception_train 我总是得到以下信息:

当然,我会说它有 99.9999% 的机会是错字。于是我尝试用 python 运行 inception_train.py。我不得不更改一些导入位置,最后它使用参数运行。但是,在初始化 CUDA 驱动程序后,脚本会停止并且没有任何错误消息。

任何有关如何解决此问题(或执行微调/重新训练)的帮助将不胜感激。

  • 张量流版本:0.9rc0
  • CPU : Xeon 5, 24 核
  • GPU:网格 K2 8 GB
  • 操作系统:Ubuntu 14.04

顺便说一句,我已经将此作为 Github 问题发布(已关闭,因为它更像是 Stack Overflow 的一个案例)。

0 投票
1 回答
2167 浏览

python - 如何在 Tensorflow 中加载预训练的 LSTM 模型权重

我想在 Tensorflow 中实现一个具有预训练权重的 LSTM 模型。这些权重可能来自 Caffee 或 Torch。
我发现文件中有 LSTM 单元格rnn_cell.py,例如rnn_cell.BasicLSTMCellrnn_cell.MultiRNNCell。但是我怎样才能为这些 LSTM 单元加载预训练的权重。

0 投票
1 回答
3120 浏览

python - Tensorflow——迁移学习实现(语义分割)

我正在实现一个 CNN 架构(FCN-8s 模型,带有预训练的 VGG16 模型),用于对我自己的数据进行语义分割(2 类,因此,每个像素的二进制分类)

我打算如何解决这个问题:

  1. 加载带有权重的预训练模型
  2. 添加/删除额外的更高层以转换为 FCN
  3. 冻结预训练模型的较低层(在训练阶段不更新)
  4. 在特定数据集上训练网络

假设这是正确的,我该如何冻结我的 tensorflow 模型的较低层?(我正在寻找具体的实现细节)我看过 Inception retraining on TensorFlow 教程,但我还不太确定。

这是我想到的工作流程:

  1. 通过现有的预训练模型运行我的数据,并提取特征输出,而无需对其进行训练。(如何?)

  2. 将这些特征输出输入到另一个包含更高层的网络中 - 并开始对其进行训练。

任何的意见都将会有帮助!

否则,如果我错了,我该怎么想?

更新:

我在下面接受了chasp255的建议,并尝试使用tf.stop_gradient来“冻结”我模型中的较低层。显然,我的实现有问题。可能的替代方案/建议?

该模型是基于 FCN(用于语义分割)论文构建的。我logits从模型架构中提取,即我的特征,我最初直接将其输入到一个loss函数中,以使用 softmax 分类器将其最小化。(按像素分类)deconv_1是我的 logits 张量,形状[batch, h, w, num_classes] = [1, 750, 750, 2]实现:

然后我运行这些图形操作如下:

因此,当我运行训练周期时,没有优化损失值,这绝对是因为我如何引入tf.stop_gradientOp.

有关更多详细信息,我的损失函数如下:

0 投票
1 回答
843 浏览

tensorflow - 如何在 get_collection 中使用 tensorflow 占位符

所以,我对提要变量有一些问题。我想冻结我的模型在整个时代的权重和偏差。我有下一个变量:

例如,我想在前 10 个 epoch 训练 [wc1, bc1],然后在下一个 epoch 训练 [wc2, bc2],依此类推。为此,我创建了变量集合:

并为集合名称创建占位符:

接下来我尝试在我的优化器中获取它:

饲料数据:

我得到错误:

那么,有什么方法可以在会话中更改训练变量?

谢谢。

0 投票
1 回答
100 浏览

caffe - 如何保存预训练的 caffe 模型的子集?

我正在研究具有 3 层的预训练 caffe 模型(在 python 中)。我想分解这个 caffe 模型并创建一个与该模型的第一层相同的新模型。例如:

原始 Caffe 模型数据 -> conv1_1 -> conv1_2 -> conv2_1 -> conv2_2 -> conv3_1 -> conv3_2

新的 Caffe 模型数据 -> conv1_1 -> conv1_2

有谁能够帮助我?

0 投票
1 回答
1003 浏览

python-2.7 - 预训练的检查点 (.chkpt) 与 GraphDef (.pb)

我正在尝试通过使用预先训练的网络来提取新数据集的特征,例如谷歌在张量流(inception-2015-12-05.tgz)中发布的classify_image_graph_def.pb。我成功了,因为transfer_learning有教程,它使用分类图像图形定义.pb (inception_v3.pb) 来提取新数据集的裂缝。

但是,在新版本的预训练模型中,tensorflow 提供了检查点文件(例如 resnet_v1_152.ckpt)而不是 Graph_def(例如 resnet_v1_152.pb)。我想知道如何使用这些检查点文件来提取像transfer_learning中的特征。谁能给我一些指示?

0 投票
0 回答
268 浏览

docker - Tensorflow image_retraining:未找到 docker 中的重新训练

我是 tensorflow 的新手,但我似乎不明白一些东西。

我用 docker 容器( docker run -d -it gcr.io/tensorflow/tensorflow:latest-devel )安装了 TF,它创建了我的容器,里面有张量流。

我现在正在尝试使用 Inceptionv3(https://www.tensorflow.org/versions/r0.9/how_tos/image_retraining/index.html),但 id 不起作用,我找不到“tensorflow/examples/ image_retraining:retrain" 在我的容器中的任何地方

我认为我的安装是问题,所以我启动了一个新的 ubuntu 容器并尝试手动安装张量流、bazel 和所有东西,但它不起作用。

有人知道我如何解决我的问题。

谢谢您的帮助!