问题标签 [deep-learning]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
machine-learning - 为什么 NLP 和机器学习社区对深度学习感兴趣?
为什么 NLP 和 ML 社区对深度学习有很大的兴趣?为什么他们需要方法来学习复杂的非线性关系?
matlab - 用于分类的深度学习网络
我知道这是一个普遍的问题,但我想要一些反馈。所以,我有一个图像分类任务,我试图用神经网络来解决。我已经有了我的特征向量。有 3 个显着特征向量(2d 空间中的点坐标),每个可以属于三个类。在这 3 个功能中,这些类并不相同。(例如,一个可能是“直上”另一个“圆形方形三角形”)。这些组合在 6 个输出类中的整体分类任务中(不是 27 个,因为组合的数量可能暗示)。那么,问题是什么:深度学习网络/卷积网络是解决这个问题的好方法吗?或者你更喜欢别的东西?(我刚开始学习这些,还不能下定决心,
machine-learning - 卷积神经网络的正确架构是什么?
我见过几种不同的卷积神经网络 (CNN) 架构。我很困惑哪一个是标准,我如何决定使用什么。我不会被使用的层数或所涉及的参数数量弄糊涂;我对网络的组件感到困惑。
假设:
CL = 卷积层 SL = 下采样层(池化) CM = 卷积映射 NN = 神经网络 Softmax = softmax 分类器(类似于线性分类器)
架构 1 https://www.youtube.com/watch?v=n6hpQwq7Inw
CL,SL,CL,SL,CM,Softmax
架构 2(最后我们真的需要 NN 吗?) http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=5605630&tag=1
CL、SL、CL、SL、NN、Softmax
建筑 3 我的想法
CL、SL、CL、SL、Softmax
machine-learning - 我们如何在卷积神经网络中获取/定义过滤器?
How to implement a deep autoencoder (eHow do i get filters from convulutional neural network(CNN)? 我的想法是这样的:对输入图像(28x28)做随机图像并获得随机补丁(8x8)。然后使用自动编码器学习补丁的共同特征(特征 = 隐藏单元;例如,大约 100 个)。然后将特征过滤器应用于输入图像并进行卷积。我正确吗?
我很困惑,因为有时文献状态只使用类似的过滤器,例如 8,但在我的情况下,我有 100..g。2 层或 3 层)?有什么想法或资源吗?
c++ - 标记图像中的像素以进行分类
我想了解更多关于如何在图像中标记像素的信息。我想使用 Caffe 中的算法来提出边缘检测程序。到目前为止,我已经过滤了图像以获得边缘并成功编写了代码来检测像素是否是边缘(依赖于其相邻像素)。我现在要做的就是将这些标记为边缘,以便我可以将它们作为训练数据提供给我的算法。我是 C++ 和 Caffe 的初学者。我真正需要的是有人来解释标签的确切工作原理,我会说去它认为是边缘的每个像素并给它边缘的值 1 和非边缘的值 0 吗?如果是这样,我该怎么做?参考资料和分步指南非常受欢迎,因为我在这项任务上已经苦苦挣扎了一段时间。
好的,例如我达到了这个代码:
是否有可能将这些像素标记为边缘?假设我采用将边缘颜色更改为红色的代码(在 if 语句之后)修改它以将像素标记为边缘或不。因此,我有一个向量携带有关像素的信息:颜色(3 个向量元素)和标签(1 个向量元素)
谢谢
machine-learning - 通过受限的 Boltzmann 机进行数据传播
在 RBM 中,它使节点内的所有关系发生概率。那么如何通过 RBM 传播数据呢?只是一阶抽样?那么波动不会太大吗?
还是它像前馈 mlp 一样工作?(即 hj = \sum_i vi * wij)但在 RBM 中没有这个概念,因为所有论文都说它是随机模型。
ubuntu-14.04 - Caffe ImageNet 32X32 图像
所以我的问题包括当我将它们调整为 256X256 时,无法用较小的图像(32X32)训练图像网络,一切都开始正常训练。所以我知道问题出在我的设置上。
我试图设置我自己的设置:
deploy.prototxt:我将最后 2 个 input_dims 设置为 32
solver.prototxt:我设置了solver_mode:CPU(不理会其他所有内容)
train_val.prototxt:我为这两个设置设置crop_size:31
所有路径都是正确的,因为训练运行良好,图像大小调整为 256X256
但是通过我上面描述的设置,我得到了这个错误:
如果有人可以解释我应该在这些文件中更改哪些其他设置,还是我做错了?
我试过按照本教程进行操作,但没有退出: http: //drubiano.github.io/2014/06/18/caffe-custom-data.html
neural-network - 使用 theano 的 LSTM 实现
我正在使用 theano 扫描函数来实现 LSTM(长期短期记忆),但我得到了类似的错误
我像这样使用扫描
step_fprop 定义如下:
任何人都知道为什么我不断收到这种错误。
machine-learning - 将深度学习用于一维标记数据是否合理?
我一直在使用 SVM 训练和测试一维数据(15000 个样本点用于训练,7500 个样本点用于测试),到目前为止它已经带来了令人满意的结果。但是为了改善结果,我正在考虑使用深度学习来做同样的事情。它能改善结果吗?为了快速实现深度学习算法,我应该学习什么?我是 DL 领域的新手,但想要快速实施,如果有理由的话。