问题标签 [recurrent-neural-network]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
519 浏览

c++ - 使用 Hopfield 神经网络读取 WAV 文件的数据部分以进行语音识别

我想写一个声音识别程序。我有算法,但我无法正确读取麦克风的声音。我有一个来自https://stackoverflow.com/的代码,女巫从 wav 文件中读取数据,但我不知道如何将 wav 原始数据放入二进制向量或数组中。所以基本上我需要一个包含数据位(1-s 或 0-s)的二进制向量或数组,它必须是 2000-4000 位长。我怎样才能做到这一点?

(我将它与 Hopfield 神经网络一起使用)

0 投票
1 回答
385 浏览

python - Theano,循环神经网络,误差为 nan

我正在尝试复制最近关于单一进化神经网络的工作。改编自作者发布的代码,我写了如下代码

但是在 6.23 的初始错误之后,我得到了所有的 nans。有人可以解释代码中是否存在错误。我发布了整个代码,这样我就不会错过错误的部分(而且我不知道它是哪一个)

谢谢!

0 投票
0 回答
914 浏览

python - 请求示例:Python 的 Caffe RNN/LSTM 回归

我几乎一直在寻找我可以在网络上找到的所有资源,看看是否有人发布了在 Caffe 中使用 RNN/LSTM 进行回归的示例(此处此处此处)。不幸的是,到目前为止,这些资源似乎并不存在。我正在使用python 上的Jeff Donahue版本。

我正在寻找的是非常简单的东西。例如,如果您有100个(x,y)对的数据点。你会怎么做:

  1. 创建输入矩阵。
  2. 创建延续矩阵(我们是否需要它?)
  3. 创建目标矩阵。
  4. prototxt 文件会是什么样子?
  5. 我们可以从使用这个模型中推断(做预测)吗?

此外,如果数据是多维的,前三个项目将如何。例如,Xd维向量,Yk维向量。

随意使用您自己的示例,只要它们涵盖了在 Python 下格式化数据的步骤。

我只是想指出,我还为此打开了一个 Caffe 用户的问题here

0 投票
1 回答
227 浏览

boost - Rnnlib安装范围错误

我正在通过https://github.com/meierue/RNNLIB安装 rnnlib

安装 boost 和其他并完成其他步骤后,我收到错误-SeqBuffer.hpp:227: error: reference to ‘range’ is ambiguous Helpers.hpp:298: error: candidates are: template<class T> std::pair<boost::iterators::counting_iterator<Incrementable, boost::iterators::use_default, boost::iterators::use_default>, boost::iterators::counting_iterator<Incrementable, boost::iterators::use_default, boost::iterators::use_default> > range(const T&, const T&)

0 投票
1 回答
11211 浏览

tensorflow - 张量流中的最小 RNN 示例

尝试在 tensorflow 中实现一个最小的玩具 RNN 示例。目标是学习从输入数据到目标数据的映射,类似于theanets 中这个精彩的简洁示例

更新:我们快到了。剩下的唯一部分是使其收敛(并且不那么复杂)。有人可以帮助将以下内容转换为运行代码或提供一个简单的示例吗?

0 投票
1 回答
3282 浏览

speech-recognition - 如何为语音识别准备数据集

我需要训练一个双向 LSTM 模型来识别离散语音(从 0 到 9 的单个数字)我已经录制了 100 个发言者的语音。接下来我该怎么办?(假设我将它们拆分为单独的 .wav 文件,每个文件包含一个数字)我将使用 mfcc 作为网络的功能。

此外,如果我要使用支持 CTC(连接主义时间分类)的库,我想知道数据集的区别

0 投票
1 回答
122 浏览

python - 在 Theano 中计算 Rnn 梯度的问题

我正在使用 vanilla Rnn,使用梯度下降(非批量版本)进行训练,并且我在(标量)成本的梯度计算方面遇到了问题;这是我的代码的相关部分:

由于某些原因,我不想将完整的(训练)数据传递给 train_model(..),而是一次传递单个示例。现在的问题是每次调用 train_model(..) 都会返回该特定示例的成本(负对数似然),然后我必须汇总(完整(训练)数据集的所有成本),然后取导数并对 sgd_step(..) 中的权重参数执行相关更新,并且由于我当前的实现的明显原因,我收到此错误:theano.gradient.DisconnectedInputError: grad 方法被要求计算相对于 a 的梯度不属于成本计算图的变量,或者仅由不可微分运算符使用:W_xh。现在我不明白如何让 '成本' 计算图的一部分(在我的情况下,当我必须等待它被聚合时)或者有没有更好/优雅的方法来实现同样的事情?

谢谢。

0 投票
1 回答
772 浏览

deep-learning - 如何从特征向量或单词生成句子?

我使用 VGG 16-Layer Caffe 模型作为图像说明,每张图像有几个说明。现在,我想从这些标题(单词)中生成一个句子。
我在一篇关于 LSTM 的论文中读到,我应该从训练网络中移除 SoftMax 层,并将层中的 4096 特征向量fc7直接提供给 LSTM。
我是 LSTM 和 RNN 的新手。
我应该从哪里开始?是否有任何教程显示如何通过序列标签生成句子?

0 投票
2 回答
1685 浏览

neural-network - 如何将 RNN 转换为回归网络?

如果输出是一个tanh函数,那么我会得到一个介于 -1 和 1 之间的数字。

如何将输出转换为我的 y 值的比例(现在恰好在 15 左右,但会因数据而异)?

或者我是否仅限于在某种已知范围内变化的功能......?

0 投票
1 回答
4121 浏览

machine-learning - 何时停止训练神经网络?

我正在尝试使用 RNN 进行特定领域的分类研究,并积累了数千万条文本。由于运行整个数据集需要几天甚至几个月的时间,我只选择了一小部分进行测试,比如 100 万个文本(80% 用于训练,20% 用于验证)。我使用词向量化对整个语料库进行了预训练,并将 Dropout 应用于模型以避免过度拟合。当它在 12 小时内训练 60000 条文本时,损失已经下降到相当低的水平,准确率达到 97%。我应该继续还是不继续?对继续训练有帮助吗?

它仍在运行第一个 epoch,恐怕如果我现在停止,模型将无法覆盖整个...