问题标签 [gated-recurrent-unit]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
14 浏览

python - GRU 中用于分类的不匹配的暗淡

我正在尝试完成一项任务并编写简单的 RNN。这是课程:

现在我没有使用 LSTM 或尝试做双向 RNN,我只想要简单的 GRU 进行无错误的训练。这是训练函数:

还有一些变量:

但我得到这个错误:

ValueError: 目标尺寸 (torch.Size([64])) 必须与输入尺寸 (torch.Size([1, 64, 1])) 相同

...在这一行:

---> 18 train_loss = loss_func(输出,标签)

我究竟做错了什么?

0 投票
0 回答
67 浏览

python - 自定义 GRU 模型 (OGRU)

我想从 tensorflow 自定义 GRU-RNN 单元。但我不知道我需要从 tensorflow 的标准 GRU 更改哪个功能。我想修改 GRU 单元以实现优化门控循环单元 (OGRU)架构。该论文与标准 GRU 的变化是输入 t 乘以Reset Gate的更新门。这里还有另一篇使用 OGRU 方法的论文。

更新门

我试图修改kaustubhhiware/LSTM-GRU-from-scratch代码,它适用于作为示例默认数据集的图像数据集。但是,我需要使用 OGRU 方法来预测不同形状输入的时间序列数据。我知道时间序列数据集的 _input 有问题,但我不知道最佳实践如何。

这是我的输入时间序列形状。批量大小 = 12

这里是图像数据集的输入形状。批量大小 = 100

这里是我的培训代码

在这里查看完整代码。

0 投票
0 回答
40 浏览

deep-learning - GRU 无法使用模型配置调用 ThenRnnForward

我正在使用 GRU 架构处理多分类问题。它似乎有一个配置错误。请帮我调试模型。提前致谢。

在这里,我提供了模型:

这是我得到的错误:

0 投票
0 回答
81 浏览

time-complexity - LSTM,门控循环单元(GRU)的时间复杂度是多少?

谁能用 Big-O 表示法解释 LSTM 和 GRU 的时间复杂度?

鉴于以下链接,我无法理解如何计算 GRU 的复杂性: 1

0 投票
1 回答
136 浏览

python - 构建用于股票预测的快速 GRU 模型

我是初学者,RNNsGRU为股票预测建立一个运行模型门控循环单元。

我有一个用于这种形状的训练数据的 numpy 数组:

My is (1122,) 并用和train_y.shape表示二进制变量。是买是卖。1010

考虑到这一点,我开始尝试我的GRU模型:

显然我输入模型的尺寸不正确,但我不明白它们应该如何适应,所以模型可以顺利运行。

0 投票
1 回答
52 浏览

python - 对于 GRU,mat1 和 mat2 形状不能相乘

我正在创建一个 GRU 来为项目进行一些分类,而且我对 Pytorch 和实现 GRU 还比较陌生。我知道类似的问题已经得到解答,但我似乎无法为自己的问题提供相同的解决方案。我知道我的 fc 阵列的形状/顺序存在问题,但是在尝试更改内容后,我再也看不到木头的树木了。如果有人能指出我正确的方向,我将不胜感激。

下面我附上了我的代码和错误。我使用的数据集包含 24 个特征,第 25 列带有标签。

0 投票
0 回答
23 浏览

python - Pytorch GRU 在一个类上训练来预测未标记的数据

我正在创建一个 GRU 来预测来自设备的流量数据包的数据是否被认为是安全的或异常的。我计划通过仅在安全/正常操作数据上训练模型然后让它检查它认为新的看不见的流量是什么来做到这一点(测试)。我希望只在安全数据(一类)上进行训练,因为攻击可以采取多种形式,我不想在标记的攻击数据上训练模型,然后让它错过我没有训练过的攻击类型(基本上我想过度拟合正常的操作数据)。因此,我需要它能够检查传入的未标记数据是否与它已经训练过的一类匹配(即传入的数据是否与设备的正常操作匹配)或者它是否异常。

我遇到的问题是,由于该模型仅在一个类上进行训练,因此很难将异常的看不见的数据与正常数据区分开来,并且几乎将所有它认为正常的数据都视为正常(与它所训练的类相同)。

因此,如果有人有任何想法或可以指出我通过模型实现的方式中的缺陷,我将不胜感激。