问题标签 [tf.keras]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

1831 问题

0 投票

1 回答

1195 浏览

tensorflow - 如何使用 TensorFlow 的 Keras API 为每个 epoch 的保存模型生成唯一名称

我正在训练模型fit_generator()并希望为每个时代保存的 wights 生成唯一的名称

已经尝试过：查看后面的代码

代码：

预期：生成唯一的检查点名称
，例如 epoch_4.ckpt 或 epoch_5.ckpt
实际：每次保存时，覆盖现有检查点

tensorflow tf.keras

2019-04-11T07:47:27.127

0 投票

1 回答

36 浏览

python - 训练转换后的输出

我有一个循环神经网络模型，可以将一个(N,)序列映射到一个(N,3)长度序列。我的目标输出实际上是(N,N)矩阵。但是，我在 numpy 中实现了一个确定性函数，它以我想要的特定方式转换(N,3)为这些矩阵。(N,N)如何在训练中使用此操作？即目前我的神经网络正在给出序列，我如何在调用之前(N,3)执行我的函数将其转换为(N,N)这些序列？keras.fit

编辑：我还应该注意，从 to 执行反向功能要困难得多，(N,N)因此将我的目标输出转换为输出表示(N,3)不是一个可行的选择。(N,3)

python keras tf.keras

2019-04-12T02:41:30.057

0 投票

2 回答

1172 浏览

tensorflow - 预期 input_1 有 3 个维度，但得到了形状为 (3, 4) 的数组

这是我的代码的简化版本，它会引发标题中提到的错误：

这是代码的输出：

我正在使用这个 csv 文件进行演示

前两列是来自两个不同通道的特征列，最后一列包含标签。我需要使用例如四行数据的序列作为输入模型的时间，而批量大小例如为三，因此输入形状就像三批四行，其中每行包含两个值。我想我需要使用某种重塑功能，但不知道如何。有人可以告诉我如何解决这个问题吗？

tensorflow reshape tf.keras

2019-04-14T06:43:40.390

0 投票

1 回答

772 浏览

keras - Keras 中的 TypeError：即使已经提供了 shuffle="batch"，也可以通过 shuffle="batch"

我正在尝试使用带有 tf.keras 的 fit() 方法训练我的模型，因为输入数据来自hdf5文件，所以我将参数shuffle='batch'传递给fit()方法。但在第一个 epoch 结束后，出现以下错误：

这是我的 fit() 方法：

变量features_train和features_val取自 hdf5 文件。

keras deep-learning hdf5 tf.keras

2019-04-14T07:57:43.207

0 投票

1 回答

253 浏览

python - tensorflow 2.0，调用函数时给出了两个变量，但是，定义函数时，没有变量

我正在关注tensorflow-2.0中的教程。定义生成器时，没有给出变量，但调用函数时，给出了两个变量。

这是 tensorflow 网站上的官方教程。

python tensorflow deep-learning tf.keras tensorflow2.0

2019-04-14T21:15:21.593

0 投票

1 回答

934 浏览

tensorflow - tf.keras.Model.predict 和调用返回不同的结果

tf.keras.Model.predict并调用返回不同的结果

sess.run(y_test)应该与相同model.predict(np.array([[1.,1.],[1.,1.]]))，但事实是它们不同。为什么？

tensorflow keras tf.keras

2019-04-15T06:05:43.093

0 投票

3 回答

4454 浏览

tensorflow - tf.keras.Model 的子类不能得到 summay() 结果

我想构建子类tf.keras.Model并希望看到具有summary功能的模型结构。但它不起作用。以下是我的代码：

错误：

ValueError：此模型尚未构建。首先通过调用build()或调用fit()一些数据来构建模型，或者 input_shape在第一层中指定一个参数以进行自动构建。

tensorflow keras tf.keras

2019-04-15T08:11:37.377

0 投票

0 回答

117 浏览

python - tf.keras：为 model.fit 提供额外的值

假设您有一个布尔值tf.placeholder，并且您想在调用时输入它Model.fit。你会怎么做？下面是一些说明问题的可运行虚拟代码。

请记住，布尔值只是为了让事情变得简单。实际上，我有作为迭代器句柄的字符串，需要输入（基于我想要训练的数据集）。

我怎样才能model.fit用这种布局做 keras 的惊人界面？

另一种选择是我在这个问题中提出的问题

python tensorflow keras keras-layer tf.keras

2019-04-15T09:25:16.140

0 投票

0 回答

104 浏览

python - 在 tf.keras.Model 中访问训练操作

一个人如何从 ? 访问培训操作tf.keras.models.Model？考虑以下：

上面代码中的倒数第二行应该是模型训练的什么？

python tensorflow keras tf.keras

2019-04-15T10:18:13.527

0 投票

0 回答

232 浏览

python - 嵌套顺序模型未训练

我正在尝试建立几个模型来预测不同的市场发展，每个模型都使用相同的编码器网络。所以我定义了一个共享的 LSTM 网络，如下所示：

我还为每个市场定义了一个类，它有以下模型作为成员：

到目前为止一切顺利，模型都可以根据各自的数据进行训练。LSTM 模型构建一次，并作为encoder_model. 我的目标是让 LSTM 学习创建一个潜在空间，然后其他密集层使用该潜在空间进行预测。然而，在检查直方图后，我意识到编码器网络权重根本没有变化。

我检查了trainable_variables所有层都列出了，所以理论上这应该可行，对吧？我还通过以下方式在训练步骤之前保存了编码器权重

并将它们与训练后的权重进行比较

果然，权重根本没有改变（打印出来的结果只包含0）

我错过了什么？梯度不应该也通过 Sequential LSTM 网络传播吗？因为我只添加了两层，所以渐变不应该消失，对吧？

python tensorflow tf.keras tensorflow2.0

2019-04-15T14:59:12.780

1 2 3 4 5 6 7 8 9 10