问题标签 [tf.keras]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1195 浏览

tensorflow - 如何使用 TensorFlow 的 Keras API 为每个 epoch 的保存模型生成唯一名称

我正在训练模型fit_generator()并希望为每个时代保存的 wights 生成唯一的名称

已经尝试过:查看后面的代码

代码:

预期:生成唯一的检查点名称
,例如 epoch_4.ckpt 或 epoch_5.ckpt
实际:每次保存时,覆盖现有检查点

0 投票
1 回答
36 浏览

python - 训练转换后的输出

我有一个循环神经网络模型,可以将一个(N,)序列映射到一个(N,3)长度序列。我的目标输出实际上是(N,N)矩阵。但是,我在 numpy 中实现了一个确定性函数,它以我想要的特定方式转换(N,3)为这些矩阵。(N,N)如何在训练中使用此操作?即目前我的神经网络正在给出序列,我如何在调用之前(N,3)执行我的函数将其转换为(N,N)这些序列?keras.fit

编辑:我还应该注意,从 to 执行反向功能要困难得多,(N,N)因此将我的目标输出转换为输出表示(N,3)不是一个可行的选择。(N,3)

0 投票
2 回答
1172 浏览

tensorflow - 预期 input_1 有 3 个维度,但得到了形状为 (3, 4) 的数组

这是我的代码的简化版本,它会引发标题中提到的错误:

这是代码的输出:

我正在使用这个 csv 文件进行演示

前两列是来自两个不同通道的特征列,最后一列包含标签。我需要使用例如四行数据的序列作为输入模型的时间,而批量大小例如为三,因此输入形状就像三批四行,其中每行包含两个值。我想我需要使用某种重塑功能,但不知道如何。有人可以告诉我如何解决这个问题吗?

0 投票
1 回答
772 浏览

keras - Keras 中的 TypeError:即使已经提供了 shuffle="batch",也可以通过 shuffle="batch"

我正在尝试使用带有 tf.keras 的 fit() 方法训练我的模型,因为输入数据来自hdf5文件,所以我将参数shuffle='batch'传递给fit()方法。但在第一个 epoch 结束后,出现以下错误:

这是我的 fit() 方法:

变量features_trainfeatures_val取自 hdf5 文件。

0 投票
1 回答
253 浏览

python - tensorflow 2.0,调用函数时给出了两个变量,但是,定义函数时,没有变量

我正在关注tensorflow-2.0中的教程。定义生成器时,没有给出变量,但调用函数时,给出了两个变量。

这是 tensorflow 网站上的官方教程。

0 投票
1 回答
934 浏览

tensorflow - tf.keras.Model.predict 和调用返回不同的结果

tf.keras.Model.predict并调用返回不同的结果

sess.run(y_test)应该与 相同model.predict(np.array([[1.,1.],[1.,1.]])),但事实是它们不同。为什么?

0 投票
3 回答
4454 浏览

tensorflow - tf.keras.Model 的子类不能得到 summay() 结果

我想构建子类tf.keras.Model并希望看到具有summary功能的模型结构。但它不起作用。以下是我的代码:

错误:

ValueError:此模型尚未构建。首先通过调用build()或调用fit()一些数据来构建模型,或者 input_shape在第一层中指定一个参数以进行自动构建。

0 投票
0 回答
117 浏览

python - tf.keras:为 model.fit 提供额外的值

假设您有一个布尔值tf.placeholder,并且您想在调用时输入它Model.fit。你会怎么做?下面是一些说明问题的可运行虚拟代码。

请记住,布尔值只是为了让事情变得简单。实际上,我有作为迭代器句柄的字符串,需要输入(基于我想要训练的数据集)。

我怎样才能model.fit用这种布局做 keras 的惊人界面?

另一种选择是我在这个问题中提出的问题

0 投票
0 回答
104 浏览

python - 在 tf.keras.Model 中访问训练操作

一个人如何从 ? 访问培训操作tf.keras.models.Model?考虑以下:

上面代码中的倒数第二行应该是模型训练的什么?

0 投票
0 回答
232 浏览

python - 嵌套顺序模型未训练

我正在尝试建立几个模型来预测不同的市场发展,每个模型都使用相同的编码器网络。所以我定义了一个共享的 LSTM 网络,如下所示:

我还为每个市场定义了一个类,它有以下模型作为成员:

到目前为止一切顺利,模型都可以根据各自的数据进行训练。LSTM 模型构建一次,并作为encoder_model. 我的目标是让 LSTM 学习创建一个潜在空间,然后其他密集层使用该潜在空间进行预测。然而,在检查直方图后,我意识到编码器网络权重根本没有变化。

我检查了trainable_variables所有层都列出了,所以理论上这应该可行,对吧?我还通过以下方式在训练步骤之前保存了编码器权重

并将它们与训练后的权重进行比较

果然,权重根本没有改变(打印出来的结果只包含0)

我错过了什么?梯度不应该也通过 Sequential LSTM 网络传播吗?因为我只添加了两层,所以渐变不应该消失,对吧?