问题标签 [gated-recurrent-unit]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2506 浏览

nlp - 如何在pytorch中获得双向2层GRU的最终隐藏状态

我正在努力理解如何获取隐藏层并将它们连接起来。

我以下面的代码为例:

hidden = torch.cat((hidden[-2,:,:], hidden[-1,:,:]), dim = 1)我没有得到它的行。

据我了解,我这样做是行不通的。

有人可以解释一下。我浏览了 PyTorch 文档,但没有得到。

0 投票
1 回答
148 浏览

nlp - 槽填充意图检测联合模型

大家好,我为聊天机器人开发了两个 RNN 模型。假设用户说:“告诉我明天巴黎的天气如何”。第一个模型将能够识别用户的意图 WEATHER_INFO ,而第二个模型将能够从 LOC:Paris 和 DATE:tomorrow 等短语中提取有意义的信息当然还有许多其他意图类别,例如 MUSIC_PLAY 等等. 由于这两个模型没有以任何方式链接到同一个短语,我们可以得到例如结果意图:WEATHER_INFO 和 TITLE:Paris,其中插槽 TITLE 与 MUSIC_PLAY 意图相关联 许多研究人员试图通过创建联合模型来提高性能两个模型使用另一个模型以避免这种错误在这里我的插槽填充代码

这里是意图检测NN的代码

我想要的是合并这两种架构以获得这个 在此处输入图像描述

请帮助我...提前谢谢

0 投票
2 回答
559 浏览

deep-learning - 输入张量和隐藏张量不在同一个设备上,发现输入张量在 cuda:0 和隐藏张量在 cpu

这是我的 lstm 网络代码,我将其实例化并传递给 Cuda 设备,但仍然收到隐藏和输入不在同一设备中的错误

我想建立的连接图片,请指导我实现它

单击此处查看错误按摩的图像

0 投票
0 回答
86 浏览

python - 触发词检测训练给出错误的预测

完成Andrew ng课程中触发词检测的作业后。我做了一些训练示例并尝试了相同的模型,但尽管准确度为 0.88(考虑到数据的偏度,这并不是很好),但模型在预测时表现非常糟糕。背景音频给出的概率为 0.44,而任何其他声音的概率都低于这个值。

形状(trainx)=(100,5511,101)

形状(训练)=(100,1375,1)

模型:

培训是否通过

预言

我检查了似乎没有任何错误的训练标签。在训练时,我的验证准确度比训练准确度提高得非常快,这也令人困惑。任何人,请解释一下发生了什么错误。提前致谢 :)

0 投票
3 回答
7786 浏览

python-3.x - 在pytorch中重置神经网络的参数

我有一个具有以下结构的神经网络:

我需要通过重置神经网络的参数将模型恢复到未学习状态。我可以nn.Linear使用以下方法对图层执行此操作:

但是,要重置nn.GRU图层的权重,我找不到任何这样的片段。

我的问题是如何重置nn.GRU图层?任何其他重置网络的方式也可以。任何帮助表示赞赏。

0 投票
1 回答
280 浏览

tensorflow - 寻找 TensorFlow 等效的 Pytorch GRU 功能

我对如何在 TensorFlow 中重建以下 Pytorch 代码感到困惑。它同时使用输入大小x和隐藏大小h来创建 GRU 层

本能地,我首先尝试了以下方法:

但是,我意识到它并没有真正考虑h或隐藏大小。在这种情况下我该怎么办?

0 投票
1 回答
59 浏览

pytorch - 运行 GRU 模型的问题;forward() 缺少参数

我正在研究 GRU,当我尝试进行预测时,我收到一个错误,表明我需要为 forward() 定义 h。在谷歌搜索和搜索堆栈溢出数小时后,我尝试了几件事并失去了耐心。

这是课程:

然后这是我加载模型并尝试进行预测的地方。这两个都在同一个脚本中。

没有 Gmodel 的任何其他参数,我得到以下信息:

0 投票
0 回答
129 浏览

python - 为什么我的函数对 LSTM 有很好的价值,但对 GRU 没有?

我正在尝试实现一个程序,将 LSTM 的性能与 GRU 的单词预测性能进行比较。我对它们都使用相同的参数,但是当我为 LSTM 获得良好的困惑值时,我获得的 GRU 值绝对是糟糕的。我最近尝试调试训练函数,因为它最初只针对 LSTM 模型而不是 GRU 模型。正如我已经说过的,这两个模型应该得到相似的值,但是现在 LSTM 模型从大约 150 的困惑度开始并收敛到正常值,而 GRU 模型从 1000 秒内的某个随机值开始,根本不收敛.

我对所有 RNN、LSTM 和 GRU 的东西都很陌生,所以如果我遗漏了一些明显的东西,请原谅我。任何帮助将不胜感激!

我使用以下两种模型:

训练功能:

隐藏状态初始化:

0 投票
2 回答
1795 浏览

python - RNN - RuntimeError:输入必须有 3 个维度,得到 2

我收到以下错误:

RuntimeError:输入必须有 3 个维度,得到 2

我有一个单一的特征列,我试图将它输入到 GRU 神经网络中。

下面是我的数据加载器和神经网络。当我检索一批数据时,我还包括了我的数据加载器的输出。

我究竟做错了什么???

当我传入数据时,会生成以下批次……</p>

0 投票
2 回答
8237 浏览

python - AttributeError:“元组”对象没有属性“大小”

更新:回顾这个问题后,大部分代码都是不必要的。长话短说,Pytorch RNN 的隐藏层需要是一个火炬张量。当我发布问题时,隐藏层是一个元组。

下面是我的数据加载器。

我不知道出了什么问题。当我尝试开始训练模型时,我收到错误消息: