问题标签 [gated-recurrent-unit]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1270 浏览

tensorflow - 如何在每个 epoch 后重置 tensorflow 中 GRU 的状态

我正在使用 tensorflow GRU 单元来实现 RNN。我将上述视频与最长 5 分钟的视频一起使用。因此,由于下一个状态是自动输入到 GRU 中的,如何在每个 epoch 之后手动重置 RNN 的状态。换句话说,我希望训练开始时的初始状态始终为 0。这是我的代码片段:

任何帮助深表感谢!

0 投票
1 回答
1687 浏览

tensorflow - 将稀疏 IndexedSlices 转换为密集张量

我收到以下警告:

对于以下代码:

那就是我利用 GRU 网络嵌入层的 WordSeq(来自 WordBatch)输出。我应该如何修改代码以使其在不转换为密集张量的情况下工作?

0 投票
0 回答
94 浏览

python - keras中具有随机选择数据的GRU

我使用一个循环网络(在特殊的 GRU 中)来预测一个长度为 90 次的时间序列。数据的类型是多变量的,下面这个例子。

多变量时间序列

选项1:

我使用 keras 开发 rnn

并且误差较小的结果看起来像图像(有相同结果的各种实验)

绘图选项 1

选项 2:

并且错误较少的结果打印为

选项 2 结果

可以将sklearn的“train_test_split”与随机选择的数据一起使用吗?

如果 GRU 对连续数据更好,为什么连续数据的结果比随机选择数据更好?

0 投票
1 回答
2856 浏览

python - Keras GRUCell 缺少 1 个必需的位置参数:'states'

我尝试用 Keras 构建一个 3 层 RNN。部分代码在这里:

然后我遇到了这个错误:

错误详情如下:

0 投票
1 回答
1312 浏览

python - 在 Keras 中使用 GRU 实现 Seq2Seq

我从 Keras 站点植入了 10 分钟的 LSTM 示例,并调整网络以处理词嵌入而不是字符嵌入(来自https://blog.keras.io/a-ten-minute-introduction-to-sequence-to-序列学习在 keras.html 中)。它工作得很好。

但是现在我很难使用 GRU 而不是 LSTM。调整变量后,编译和训练(拟合函数)起作用了。但是当我尝试使用网络通过自定义输入对其进行测试时,它会抛出:

尺寸必须相等,但输入形状为 [1,?,?,232], [?,256] 的“添加”(操作:“添加”)为 232 和 256

LSTM 的相关工作代码是:

GRU代码是:

我用“#这是错误出现的地方”标记了错误的发生。

感谢您提供的任何帮助,是的,我需要尝试这两个系统来比较它们与给定数据集的差异。

0 投票
3 回答
1604 浏览

python - Keras GRU 模型仅预测 [-0., -0., -0., -0., -0.]

我试图根据之前的 50 个输入预测 5 个加密货币的周期性价格。

在这里,我有 50 个先前的样本 x 8 个特征作为输入样本和 5 个下一个时期的价格作为输出

我已经用这段代码构建了模型:

这给了我输出:

在这一步之后,我尝试预测 X_test 的输出,但我得到的不是预测,而是形状正确但充满零而不是任何预测的矩阵:

为什么我会变得这么糟糕?我是否使用正确的方式来做我想做的事?

UPD是完整的笔记本。

0 投票
1 回答
183 浏览

deep-learning - how does LSTM and GRU gates decide which word to keep in the memory

the update gate in a GRU decides which word to keep in the cell or to be clear what is the cell state. how does the update gate in gru decide when to be close to 1 and when to be close to 0? Basically, how does it decide to keep a word and not to keep a word? Thanks

0 投票
2 回答
3468 浏览

machine-learning - 股票预测:GRU 模型预测相同的给定值而不是未来的股票价格

我只是从 kaggle 测试这个模型,这个 模型假设从给定的最后一组股票预测提前 1 天。如您所见,在调整了几个参数后,我得到了令人惊讶的好结果。 在此处输入图像描述 均方误差为 5.193。所以总体而言,它看起来很擅长预测未来的股票,对吧?好吧,当我仔细查看结果时,结果却很糟糕。

如您所见,该模型正在预测给定股票的最后价值,这是我们当前的最后一只股票。
所以我确实将预测调整为后退一步。 在此处输入图像描述 所以现在你可以清楚地看到该模型预测的是后退一步或最后的股票奖励,而不是未来的股票预测。

这是我的训练数据

这是我的模型

这是我完整代码,您也可以在google colab.

所以我的问题是它背后的原因是什么?我在做什么错任何建议?

0 投票
2 回答
2436 浏览

python - 在 Keras 中使用 GRU 的 RNN

我想在 python 中使用 Keras 用 GRU 实现递归神经网络。我在运行代码时遇到问题,我越来越多地更改变量,但它不起作用。你有解决它的想法吗?

但是我收到以下错误:

0 投票
1 回答
31 浏览

python - 了解神经网络的输出

我在神经网络的输出中遇到问题。

我有 3 层,在最后一层,我的激活方法是 softsign,它的准确率是 97%,但我不明白它的输出。

我该如何解释它?