问题标签 [deep-learning]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
neural-network - CNN 中的 ReLu 和 Dropout
我正在研究卷积神经网络。我对 CNN 中的某些层感到困惑。
关于ReLu...我只知道它是无限逻辑函数的总和,但是ReLu没有连接到任何上层。为什么我们需要 ReLu,它是如何工作的?
关于辍学......辍学是如何工作的?我听了 G. Hinton 的视频演讲。他说有一种策略,在训练权重时随机忽略一半节点,在预测时将权重减半。他说它的灵感来自随机森林,其工作原理与计算这些随机训练模型的几何平均值完全相同。
这个策略和dropout一样吗?
有人可以帮我解决这个问题吗?
machine-learning - 在使用函数逼近的 Q-learning 中,是否可以避免手工制作特征?
我对机器学习的背景知识很少,所以如果我的问题看起来很愚蠢,请原谅我。
根据我所读到的,迄今为止最好的无模型强化学习算法是 Q-Learning,其中代理世界中的每个状态、动作对都被赋予一个 q 值,并且在每个状态下具有最高的动作选择 q 值。然后 q 值更新如下:
Q(s,a) = (1-α)Q(s,a) + α(R(s,a,s') + (max_a' * Q(s',a'))) 其中 α 是学习速度。
显然,对于高维问题,状态的数量变得非常大,使得 q 值表存储不可行。
因此,Q-Learning 的实际实现需要通过状态泛化(即特征)来使用 Q 值近似。例如,如果代理是 Pacman,那么功能将是:
- 到最近点的距离
- 到最近鬼的距离
- 吃豆子在隧道里吗?
然后,您只需要为每个单个特征提供 q 值,而不是每个状态的 q 值。
所以我的问题是:
强化学习代理是否可以创建或生成附加特征?
我做过的一些研究:
这篇文章提到了 Geramifard 的 iFDD 方法
- http://www.icml-2011.org/papers/473_icmlpaper.pdf
- http://people.csail.mit.edu/agf/Files/13RLDM-GQ-iFDD+.pdf
这是“发现特征依赖关系”的一种方式,但我不确定这是否是特征生成,因为本文假设您从一组二进制特征开始。
我发现的另一篇论文是用深度强化学习玩 Atari,它“使用一系列神经网络架构提取高级特征”。
我已经阅读了这篇论文,但仍然需要充实/完全理解他们的算法。这就是我要找的吗?
谢谢
python - 无法运行 python make_dataset.py -pylearn2 - 训练模型
我安装了 Pylearn2,我想使用 pylearn2 训练模型。在此处参考:在此处输入链接描述
但我只是运行第 1 步:创建数据集,从 grbm_smd 目录,运行命令 $python make_dataset.py ,我得到错误:
$ python make_dataset.py
加载文件/Users/k11067kk/pylearn2_data/cifar10/cifar-10-batches-py/data_batch_1
回溯(最近一次通话最后):
文件“make_dataset.py”,第 27 行,在
文件“/Users/k11067kk/pylearn2/pylearn2/datasets/cifar10.py”,第 73 行,在init
文件“/Users/k11067kk/pylearn2/pylearn2/datasets/cifar10.py”,第 257 行,在 _unpickle
TypeError: load() 没有关键字参数
我做了一些测试,并设置了这样的路径: $export PYLEARN2_DATA_PATH=~/pylearn2_data 有什么问题?知道如何解决这个问题吗?谢谢!
image - Caffe 多输入图像
我正在考虑实现一个接受两个输入图像和一个标签(稍后可能是其他数据)的 Caffe CNN,并且想知道是否有人知道 prototxt 文件中的正确语法来执行此操作?它只是一个带有额外顶部的 IMAGE_DATA 层吗?或者我应该为每个使用单独的 IMAGE_DATA 层?
谢谢,詹姆斯
deep-learning - 基于逻辑回归的 SoftMax 上的序数目标的损失函数
我正在使用 Pylearn2 或 Caffe 构建一个深度网络。我的目标是名义上的。我试图找到一个合适的损失函数,但在 Pylearn2 或 Caffe 中找不到。
我读了一篇论文“偏好水平的损失函数:离散有序标签的回归”。我明白了一般的想法 - 但我不确定我是否理解阈值是什么,如果我的最后一层是基于逻辑回归的 SoftMax(输出概率)。
有人可以通过指出这种损失函数的任何实现来帮助我吗?
感谢和问候
c++ - _cvLoadImage 未定义符号链接问题
我正在我的 mac osx 上编译 conv-net ( http://conv-net.sourceforge.net/ ) 深度学习库 opencv 和 c++,我似乎无法解决这个错误。这似乎是一个链接问题。所有的 opencv 库都是为 64 位编译的,我尝试在 cmake 中设置 -m64 标志,不,仍然无法正常工作。
我不知道 _cvLoadImage() 链接到哪个库???我正确链接到正确的库,但无法修复这个错误??????
我做了一个链接器的-v输出,它显示了这个......
numpy - InfogainLoss 层
我希望InfogainLoss
在我的模型中使用类型的损失层。但是我很难正确定义它。
有没有关于
INFOGAIN_LOSS
图层使用的教程/示例?该层的输入(类概率)应该是
SOFTMAX
层的输出,还是足以输入全连接层的“顶部”?
INFOGAIN_LOSS
需要三个输入:类概率、标签和矩阵H
。矩阵H
可以作为层参数提供infogain_loss_param { source: "fiename" }
。
假设我有一个 python 脚本,它计算H
为一个numpy.array
形状(其中(L,L)
是我模型中的标签数量)。dtype='f4'
L
如何将我
numpy.array
的binproto
文件转换为可以作为infogain_loss_param { source }
模型提供的文件?假设我想
H
作为损失层的第三个输入(底部)提供(而不是作为模型参数)。我怎样才能做到这一点?
我是否定义了一个“顶部”的新数据层H
?如果是这样,这层的数据不是每次训练迭代都会增加,就像训练数据增加一样吗?如何定义多个不相关的输入“数据”层,以及 caffe 如何知道从训练/测试“数据”层批量读取,而从H
“数据”层它知道在所有训练过程中只读取一次?
python - Python缺少Theano的模块
我已经安装了 theano 一个深度神经网络库并正在尝试运行一些示例,但看起来脚本无法找到某些模块。我尝试设置路径
但两者都不起作用。我得到这个错误。我看到模块已正确安装在 theano /Library/Python/2.7/site-packages/theano/tensor/.. 的子目录中,但不知何故 python 似乎无法找到模块
请有人帮忙。我正在使用Mac。
artificial-intelligence - 用于罕见事件的无监督深度人工神经网络分类器
我构建并训练了一个无监督的深度人工神经网络来检测大型数据集中的高阶特征。
数据包括每日天气测量结果,我的深度网络最后一层的输出是 4 个神经元宽,希望能代表高阶特征。现在我想检测一个非常罕见的事件(例如龙卷风)的概率。10,000 out of 5,000,000
我挑出了导致龙卷风的数据点,但关于数据点的数据很少。
- 创建一个仅由 10,000 个
tornado
数据点组成的训练集,每次期望的输出为 1? - 创建一个由所有 5,000,000 个数据点组成的训练集,当没有龙卷风时输出 0,当有龙卷风时输出 1?但这可能永远无法预测龙卷风。
- 其他解决方案?
cuda - Caffe 安装问题
我在安装 Caffe 时遇到了一些问题。请让我知道是否有人遇到过同样的问题。谢谢。
#make runtest
.build_release/test/test_all.testbin 0 --gtest_shuffle
Cuda 设备数量:1
设置为使用设备 0
当前设备 id:0
注意:使用种子 88789 随机化测试的顺序。
[==========] 从 169 个测试用例中运行 838 个测试。
[---------] 全局测试环境设置。
[---------] ImageDataLayerTest/3 的 3 个测试,其中 TypeParam = caffe::DoubleGPU
[ RUN ] ImageDataLayerTest/3.TestResize
F0107 14:26:04.664185 3079 math_functions.cpp:91] 检查失败:错误 == cudaSuccess (11 vs. 0) 无效参数
* 检查失败堆栈跟踪:*
@ 0x2ab3f5243daa (unknown)
@ 0x2ab3f5243ce4 (unknown)
@ 0x2ab3f52436e6 (未知)
@ 0x2ab3f5246687 (未知)
@ 0x6bdc35 caffe::caffe_copy<>()
@ 0x7439af caffe::BasePrefetchingDataLayer<>::Forward_gpu()
@ 0x428da2 caffe::Layer<>::Forward()
@ 0x62ff :ImageDataLayerTest_TestResize_Test<>::TestBody()
@ 0x657363 testing::internal::HandleExceptionsInMethodIfSupported<>()
@ 0x64de07 testing::Test::Run()
@ 0x64deae testing::TestInfo::Run()
@ 0x64dfb5 testing::TestCase ::Run()
@ 0x6512f8 测试::internal::UnitTestImpl::RunAllTests()
@ 0x651587 testing::UnitTest::Run()
@ 0x41d3a0 main
@ 0x2ab3f8396ec5 (unknown)
@ 0x4243d7 (unknown)
@ (nil) (unknown)
make: *** [runtest] Aborted (core dumped)
Ubuntu 14.04
#