问题标签 [gated-recurrent-unit]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
nlp - 如何在pytorch中获得双向2层GRU的最终隐藏状态
我正在努力理解如何获取隐藏层并将它们连接起来。
我以下面的代码为例:
hidden = torch.cat((hidden[-2,:,:], hidden[-1,:,:]), dim = 1)
我没有得到它的行。
据我了解,我这样做是行不通的。
有人可以解释一下。我浏览了 PyTorch 文档,但没有得到。
nlp - 槽填充意图检测联合模型
大家好,我为聊天机器人开发了两个 RNN 模型。假设用户说:“告诉我明天巴黎的天气如何”。第一个模型将能够识别用户的意图 WEATHER_INFO ,而第二个模型将能够从 LOC:Paris 和 DATE:tomorrow 等短语中提取有意义的信息当然还有许多其他意图类别,例如 MUSIC_PLAY 等等. 由于这两个模型没有以任何方式链接到同一个短语,我们可以得到例如结果意图:WEATHER_INFO 和 TITLE:Paris,其中插槽 TITLE 与 MUSIC_PLAY 意图相关联 许多研究人员试图通过创建联合模型来提高性能两个模型使用另一个模型以避免这种错误在这里我的插槽填充代码
这里是意图检测NN的代码
请帮助我...提前谢谢
python-3.x - 在pytorch中重置神经网络的参数
我有一个具有以下结构的神经网络:
我需要通过重置神经网络的参数将模型恢复到未学习状态。我可以nn.Linear
使用以下方法对图层执行此操作:
但是,要重置nn.GRU
图层的权重,我找不到任何这样的片段。
我的问题是如何重置nn.GRU
图层?任何其他重置网络的方式也可以。任何帮助表示赞赏。
tensorflow - 寻找 TensorFlow 等效的 Pytorch GRU 功能
我对如何在 TensorFlow 中重建以下 Pytorch 代码感到困惑。它同时使用输入大小x
和隐藏大小h
来创建 GRU 层
本能地,我首先尝试了以下方法:
但是,我意识到它并没有真正考虑h
或隐藏大小。在这种情况下我该怎么办?
pytorch - 运行 GRU 模型的问题;forward() 缺少参数
我正在研究 GRU,当我尝试进行预测时,我收到一个错误,表明我需要为 forward() 定义 h。在谷歌搜索和搜索堆栈溢出数小时后,我尝试了几件事并失去了耐心。
这是课程:
然后这是我加载模型并尝试进行预测的地方。这两个都在同一个脚本中。
没有 Gmodel 的任何其他参数,我得到以下信息:
python - 为什么我的函数对 LSTM 有很好的价值,但对 GRU 没有?
我正在尝试实现一个程序,将 LSTM 的性能与 GRU 的单词预测性能进行比较。我对它们都使用相同的参数,但是当我为 LSTM 获得良好的困惑值时,我获得的 GRU 值绝对是糟糕的。我最近尝试调试训练函数,因为它最初只针对 LSTM 模型而不是 GRU 模型。正如我已经说过的,这两个模型应该得到相似的值,但是现在 LSTM 模型从大约 150 的困惑度开始并收敛到正常值,而 GRU 模型从 1000 秒内的某个随机值开始,根本不收敛.
我对所有 RNN、LSTM 和 GRU 的东西都很陌生,所以如果我遗漏了一些明显的东西,请原谅我。任何帮助将不胜感激!
我使用以下两种模型:
训练功能:
隐藏状态初始化:
python - RNN - RuntimeError:输入必须有 3 个维度,得到 2
我收到以下错误:
RuntimeError:输入必须有 3 个维度,得到 2
我有一个单一的特征列,我试图将它输入到 GRU 神经网络中。
下面是我的数据加载器和神经网络。当我检索一批数据时,我还包括了我的数据加载器的输出。
我究竟做错了什么???
当我传入数据时,会生成以下批次……</p>
python - AttributeError:“元组”对象没有属性“大小”
更新:回顾这个问题后,大部分代码都是不必要的。长话短说,Pytorch RNN 的隐藏层需要是一个火炬张量。当我发布问题时,隐藏层是一个元组。
下面是我的数据加载器。
我不知道出了什么问题。当我尝试开始训练模型时,我收到错误消息: