问题标签 [tf.keras]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
tensorflow - 如何使用 TensorFlow 的 Keras API 为每个 epoch 的保存模型生成唯一名称
我正在训练模型fit_generator()
并希望为每个时代保存的 wights 生成唯一的名称
已经尝试过:查看后面的代码
代码:
预期:生成唯一的检查点名称
,例如 epoch_4.ckpt 或 epoch_5.ckpt
实际:每次保存时,覆盖现有检查点
python - 训练转换后的输出
我有一个循环神经网络模型,可以将一个(N,)
序列映射到一个(N,3)
长度序列。我的目标输出实际上是(N,N)
矩阵。但是,我在 numpy 中实现了一个确定性函数,它以我想要的特定方式转换(N,3)
为这些矩阵。(N,N)
如何在训练中使用此操作?即目前我的神经网络正在给出序列,我如何在调用之前(N,3)
执行我的函数将其转换为(N,N)
这些序列?keras.fit
编辑:我还应该注意,从 to 执行反向功能要困难得多,(N,N)
因此将我的目标输出转换为输出表示(N,3)
不是一个可行的选择。(N,3)
tensorflow - 预期 input_1 有 3 个维度,但得到了形状为 (3, 4) 的数组
这是我的代码的简化版本,它会引发标题中提到的错误:
这是代码的输出:
我正在使用这个 csv 文件进行演示
前两列是来自两个不同通道的特征列,最后一列包含标签。我需要使用例如四行数据的序列作为输入模型的时间,而批量大小例如为三,因此输入形状就像三批四行,其中每行包含两个值。我想我需要使用某种重塑功能,但不知道如何。有人可以告诉我如何解决这个问题吗?
keras - Keras 中的 TypeError:即使已经提供了 shuffle="batch",也可以通过 shuffle="batch"
我正在尝试使用带有 tf.keras 的 fit() 方法训练我的模型,因为输入数据来自hdf5文件,所以我将参数shuffle='batch'传递给fit()方法。但在第一个 epoch 结束后,出现以下错误:
这是我的 fit() 方法:
变量features_train
和features_val
取自 hdf5 文件。
python - tensorflow 2.0,调用函数时给出了两个变量,但是,定义函数时,没有变量
我正在关注tensorflow-2.0中的教程。定义生成器时,没有给出变量,但调用函数时,给出了两个变量。
这是 tensorflow 网站上的官方教程。
tensorflow - tf.keras.Model.predict 和调用返回不同的结果
tf.keras.Model.predict
并调用返回不同的结果
sess.run(y_test)
应该与 相同model.predict(np.array([[1.,1.],[1.,1.]]))
,但事实是它们不同。为什么?
tensorflow - tf.keras.Model 的子类不能得到 summay() 结果
我想构建子类tf.keras.Model
并希望看到具有summary
功能的模型结构。但它不起作用。以下是我的代码:
错误:
ValueError:此模型尚未构建。首先通过调用
build()
或调用fit()
一些数据来构建模型,或者input_shape
在第一层中指定一个参数以进行自动构建。
python - tf.keras:为 model.fit 提供额外的值
假设您有一个布尔值tf.placeholder
,并且您想在调用时输入它Model.fit
。你会怎么做?下面是一些说明问题的可运行虚拟代码。
请记住,布尔值只是为了让事情变得简单。实际上,我有作为迭代器句柄的字符串,需要输入(基于我想要训练的数据集)。
我怎样才能model.fit
用这种布局做 keras 的惊人界面?
另一种选择是我在这个问题中提出的问题
python - 在 tf.keras.Model 中访问训练操作
一个人如何从 ? 访问培训操作tf.keras.models.Model
?考虑以下:
上面代码中的倒数第二行应该是模型训练的什么?
python - 嵌套顺序模型未训练
我正在尝试建立几个模型来预测不同的市场发展,每个模型都使用相同的编码器网络。所以我定义了一个共享的 LSTM 网络,如下所示:
我还为每个市场定义了一个类,它有以下模型作为成员:
到目前为止一切顺利,模型都可以根据各自的数据进行训练。LSTM 模型构建一次,并作为encoder_model
. 我的目标是让 LSTM 学习创建一个潜在空间,然后其他密集层使用该潜在空间进行预测。然而,在检查直方图后,我意识到编码器网络权重根本没有变化。
我检查了trainable_variables
所有层都列出了,所以理论上这应该可行,对吧?我还通过以下方式在训练步骤之前保存了编码器权重
并将它们与训练后的权重进行比较
果然,权重根本没有改变(打印出来的结果只包含0)
我错过了什么?梯度不应该也通过 Sequential LSTM 网络传播吗?因为我只添加了两层,所以渐变不应该消失,对吧?