问题标签 [recurrent-neural-network]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c++ - 使用 Hopfield 神经网络读取 WAV 文件的数据部分以进行语音识别
我想写一个声音识别程序。我有算法,但我无法正确读取麦克风的声音。我有一个来自https://stackoverflow.com/的代码,女巫从 wav 文件中读取数据,但我不知道如何将 wav 原始数据放入二进制向量或数组中。所以基本上我需要一个包含数据位(1-s 或 0-s)的二进制向量或数组,它必须是 2000-4000 位长。我怎样才能做到这一点?
(我将它与 Hopfield 神经网络一起使用)
python - Theano,循环神经网络,误差为 nan
我正在尝试复制最近关于单一进化神经网络的工作。改编自作者发布的代码,我写了如下代码
但是在 6.23 的初始错误之后,我得到了所有的 nans。有人可以解释代码中是否存在错误。我发布了整个代码,这样我就不会错过错误的部分(而且我不知道它是哪一个)
谢谢!
python - 请求示例:Python 的 Caffe RNN/LSTM 回归
我几乎一直在寻找我可以在网络上找到的所有资源,看看是否有人发布了在 Caffe 中使用 RNN/LSTM 进行回归的示例(此处、此处和此处)。不幸的是,到目前为止,这些资源似乎并不存在。我正在使用python 上的Jeff Donahue版本。
我正在寻找的是非常简单的东西。例如,如果您有100个(x,y)对的数据点。你会怎么做:
- 创建输入矩阵。
- 创建延续矩阵(我们是否需要它?)
- 创建目标矩阵。
- prototxt 文件会是什么样子?
- 我们可以从使用这个模型中推断(做预测)吗?
此外,如果数据是多维的,前三个项目将如何。例如,X是d维向量,Y是k维向量。
随意使用您自己的示例,只要它们涵盖了在 Python 下格式化数据的步骤。
我只是想指出,我还为此打开了一个 Caffe 用户的问题here。
boost - Rnnlib安装范围错误
我正在通过https://github.com/meierue/RNNLIB安装 rnnlib
安装 boost 和其他并完成其他步骤后,我收到错误-SeqBuffer.hpp:227: error: reference to ‘range’ is ambiguous
Helpers.hpp:298: error: candidates are: template<class T> std::pair<boost::iterators::counting_iterator<Incrementable, boost::iterators::use_default, boost::iterators::use_default>, boost::iterators::counting_iterator<Incrementable, boost::iterators::use_default, boost::iterators::use_default> > range(const T&, const T&)
tensorflow - 张量流中的最小 RNN 示例
尝试在 tensorflow 中实现一个最小的玩具 RNN 示例。目标是学习从输入数据到目标数据的映射,类似于theanets 中这个精彩的简洁示例。
更新:我们快到了。剩下的唯一部分是使其收敛(并且不那么复杂)。有人可以帮助将以下内容转换为运行代码或提供一个简单的示例吗?
speech-recognition - 如何为语音识别准备数据集
我需要训练一个双向 LSTM 模型来识别离散语音(从 0 到 9 的单个数字)我已经录制了 100 个发言者的语音。接下来我该怎么办?(假设我将它们拆分为单独的 .wav 文件,每个文件包含一个数字)我将使用 mfcc 作为网络的功能。
此外,如果我要使用支持 CTC(连接主义时间分类)的库,我想知道数据集的区别
python - 在 Theano 中计算 Rnn 梯度的问题
我正在使用 vanilla Rnn,使用梯度下降(非批量版本)进行训练,并且我在(标量)成本的梯度计算方面遇到了问题;这是我的代码的相关部分:
由于某些原因,我不想将完整的(训练)数据传递给 train_model(..),而是一次传递单个示例。现在的问题是每次调用 train_model(..) 都会返回该特定示例的成本(负对数似然),然后我必须汇总(完整(训练)数据集的所有成本),然后取导数并对 sgd_step(..) 中的权重参数执行相关更新,并且由于我当前的实现的明显原因,我收到此错误:theano.gradient.DisconnectedInputError: grad 方法被要求计算相对于 a 的梯度不属于成本计算图的变量,或者仅由不可微分运算符使用:W_xh。现在我不明白如何让 '成本' 计算图的一部分(在我的情况下,当我必须等待它被聚合时)或者有没有更好/优雅的方法来实现同样的事情?
谢谢。
deep-learning - 如何从特征向量或单词生成句子?
我使用 VGG 16-Layer Caffe 模型作为图像说明,每张图像有几个说明。现在,我想从这些标题(单词)中生成一个句子。
我在一篇关于 LSTM 的论文中读到,我应该从训练网络中移除 SoftMax 层,并将层中的 4096 特征向量fc7
直接提供给 LSTM。
我是 LSTM 和 RNN 的新手。
我应该从哪里开始?是否有任何教程显示如何通过序列标签生成句子?
neural-network - 如何将 RNN 转换为回归网络?
如果输出是一个tanh函数,那么我会得到一个介于 -1 和 1 之间的数字。
如何将输出转换为我的 y 值的比例(现在恰好在 15 左右,但会因数据而异)?
或者我是否仅限于在某种已知范围内变化的功能......?
machine-learning - 何时停止训练神经网络?
我正在尝试使用 RNN 进行特定领域的分类研究,并积累了数千万条文本。由于运行整个数据集需要几天甚至几个月的时间,我只选择了一小部分进行测试,比如 100 万个文本(80% 用于训练,20% 用于验证)。我使用词向量化对整个语料库进行了预训练,并将 Dropout 应用于模型以避免过度拟合。当它在 12 小时内训练 60000 条文本时,损失已经下降到相当低的水平,准确率达到 97%。我应该继续还是不继续?对继续训练有帮助吗?
它仍在运行第一个 epoch,恐怕如果我现在停止,模型将无法覆盖整个...