问题标签 [deep-learning]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
613 浏览

matlab - 如何在 geoff Hinton 的深度神经网络中测试自己的图像?

这是 Geoff Hinton 的 Matlab 代码的链接。
他为手写识别制作了这段代码。
我想要一个物体识别代码,所以我想用我自己的图像来训练它。我通过digit0.mat在文件中进行一些更改(加载我自己的图像数据集而不是)来做到这一点makebatches.m
但是我在训练后找不到,从哪里以我自己的方式测试创建的神经网络?
有人可以通过查看代码来提供帮助吗?

0 投票
2 回答
20455 浏览

neural-network - 用于音频的卷积神经网络 (CNN)

我一直在关注 DeepLearning.net 上的教程,学习如何实现从图像中提取特征的卷积神经网络。该教程解释得很好,易于理解和遵循。

我想扩展相同的 CNN 以同时从视频(图像 + 音频)中提取多模态特征。

我知道视频输入只不过是在一段时间内(例如 30 FPS)显示的与音频相关的一系列图像(像素强度)。但是,我真的不明白什么是音频,它是如何工作的,或者它是如何被分解以馈送到网络中的。

我已经阅读了几篇关于该主题的论文(多模态特征提取/表示),但没有人解释音频是如何输入到网络的。

此外,我从我的研究中了解到,多模态表示是我们大脑真正工作的方式,因为我们不会故意过滤掉我们的感官来实现理解。这一切都是同时发生的,我们通过(联合表示)不知道它。一个简单的例子是,如果我们听到狮子吼叫,我们会立即在脑海中形成狮子的形象,感到危险,反之亦然。我们的大脑中激活了多种神经模式,以全面了解狮子的外观、声音、感觉、气味等。

上面提到的是我的最终目标,但为了简单起见,我暂时将我的问题分解。

如果有人能阐明如何剖析音频,然后在卷积神经网络中表示,我将不胜感激。我也会感谢您对多模态同步、联合表示以及使用多模态数据训练 CNN 的正确方法的想法。

编辑: 我发现音频可以表示为频谱图。它是音频的常见格式,并表示为具有两个几何维度的图形,其中水平线代表时间,垂直线代表频率。

在此处输入图像描述

是否可以对这些频谱图上的图像使用相同的技术?换句话说,我可以简单地将这些频谱图用作卷积神经网络的输入图像吗?

0 投票
1 回答
1299 浏览

python - 具有目标变量作为数组而不是单个值的多层感知器

我是深度学习的新手,我一直在尝试使用 theano 库来训练我的数据。这里的MLP 教程有一个标量输出值,而我的用例有一个数组,其中 1 对应于输出中描述的值。

例如(假设可能的标量值为 0,1,2,3,4,5),

我只修改了代码来读取我的输入和输出(输出现在是 theano 中的二维数组或矩阵)。代码的其他部分与上面粘贴的 MLP 教程相同。

我得到的错误在以下函数中

错误堆栈:

我想知道如何更改此 theano.function 以将 y 值容纳为矩阵。

0 投票
2 回答
1223 浏览

sentiment-analysis - Theano 分类任务总是给出 50% 的验证错误和测试错误?

我正在使用 Theano 的 DBN(深度信念网络)和 SDA(堆叠去噪自动编码器)示例进行文本分类实验。我已经生成了一个特征/标签数据集,就像生成 Theano 的 MINST 数据集一样,并更改了这些示例的特征长度和输出值以采用我的数据集(2 个输出而不是 10 个输出,并且我的数据集采用了特征数量) . 每次我运行实验(DBN 和 SDA)时,我都会得到准确的 50% 验证错误和测试错误。你有什么想法我做错了吗?因为我刚刚从电影评论数据集中生成了一个数据集作为 MINST 数据集格式并将其腌制。

我的代码与您可以在http://www.deeplearning.net/tutorial/DBN.html中找到的 代码相同,我的 SDA 代码与您可以在 http://www.deeplearning.net/tutorial/SdA中找到的代码相同.html

唯一的区别是我制作了自己的数据集,而不是 MINST 数字识别数据集。我的数据集是来自电影评论数据集的词袋特征,它当然具有不同数量的特征和输出类,所以我只是对输入和输出类的函数参数数量进行了微小的修改。代码运行得很漂亮,但结果总是 50%。这是一个示例输出:

文件 DBN_MovieReview.py 的预训练代码运行了 430.33m

文件 DBN_MovieReview.py 的微调代码运行了 5.48m

我使用两个不同的功能集同时运行 SDA 和 DBN。所以我在所有这 4 个实验中都得到了 50% 的准确率。

0 投票
2 回答
1787 浏览

deep-learning - word2vec :以不区分大小写的方式查找相似的单词

我可以访问我感兴趣的文本语料库上的词向量。现在,我面临的问题是这些向量区分大小写,例如,“Him”与“him”不同,与“HIM”不同。

我想找到与“他”这个词最相似的词是不区分大小写的方式。我使用与 Google软件包distance.c捆绑在一起的程序。word2vec这是我面临问题的地方。

我是否应该将“他他他”作为参数传递给distance.c可执行文件。这将返回关闭到 3 个单词的单词发送。

或者我应该distance.c使用 3 个参数(“Him”、“him”和“HIM”)中的每一个单独运行程序,然后以合理的方式将这些列表放在一起以得出最相似的单词?请建议。

0 投票
1 回答
495 浏览

matrix - 深度学习网络的图形表示?

有人可以为我提供深度学习网络的图形表示吗?

像这样是第 1 层、第 2 层、第 3 层等,以及所有层的神经元与层中的神经元之间的权重,它们是如何连接的等等。

我不想要任何大的东西,我只想将它们显示在矩阵中,因为我实际上无法确定如何将整个网络表示为互连矩阵。

即使矩阵是 2x2 也没关系,我只想有一个可以构建的示例。

0 投票
1 回答
494 浏览

machine-learning - 我在哪里可以找到经过全面训练的深度网络以供下载?

我试图检验一个关于训练有素的“深度”网络统计数据的假设。近年来发表了很多令人印象深刻的结果(最近是基于多层神经网络的最先进的状态检测)。事实证明,要找到描述这些文章中使用的“最终”网络的代码非常困难。

有谁知道训练有素的网络取得了非常有竞争力的结果的体面来源?我现在对训练有素的网络布局特别感兴趣,而不是重新生成它们的代码。

0 投票
3 回答
513 浏览

machine-learning - 卷积网络的训练方法还叫深度学习吗?

在诸如 ImageNet Classification with Deep Convolutional Neural Networks 等论文中

http://www.cs.toronto.edu/~fritz/absps/imagenet.pdf

训练方法似乎是带有随机梯度下降的基本反向传播。

尽管 CNN 是深度神经网络的一部分,但这仅仅是因为存在大量隐藏层吗?这是否意味着这里的反向传播属于深度学习的范畴,因为网络很深,即使它不遵循与使用贪心逐层训练(一种真正的深度学习技术)的 DBN 之类的模式相同的模式?

感谢您的帮助和建议。

0 投票
0 回答
174 浏览

neural-network - 为什么尽管网络是对称的,但可以学习 RBM 的非对称权重?

我尝试实现受限玻尔兹曼机来确认深度学习方法的实用性。我实现了一个 RBM,并为一层重建提供了 MNIST 字符识别数据。

但是对于每个隐藏节点,学习到的边权重是相同的。

然后我想知道为什么 RBM 可以从对称网络拓扑中获得非对称滤波器。我无法从围绕 RBM 的论文的数学公式中掌握情况。

给我一个直观的见解。

0 投票
1 回答
3695 浏览

neural-network - 用于时间序列预测的深度学习神经网络

我正在开始使用人工神经网络进行互联网流量预测(时间序列预测)的工作,但我对此事的经验很少。

  1. 有谁知道哪种方法最适合?(使用哪种类型的神经网络进行时间序列预测)

  2. 无监督训练的深度学习是时间序列学习的好主意吗?