问题标签 [keras-layer]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
412 浏览

python - 查找 keras 中间表达式的维度

我正在实现一个自定义 keras 层。我班的调用方法如下。

我验证并且代码有效,但我试图找到在 keras 中实现自定义层时更好地调试的方法。假设 e1 和 e2 是 (batch_size * d) 而 W 是 (d*d) 我怎样才能找到我的表达式的每个子部分的尺寸?例如。K.dot(e2, self.W),batch_dot 等的结果。

0 投票
2 回答
1270 浏览

python-3.x - keras LSTM模型中的尺寸不匹配

我想使用带有 keras 的 LSTM 神经网络来预测时间序列组,但在使模型与我想要的匹配时遇到了麻烦。我的数据维度是:

输入张量:(data length, number of series to train, time steps to look back)

输出张量:(data length, number of series to forecast, time steps to look ahead)

注意:我想保持尺寸完全一样,没有转置。

重现问题的虚拟数据代码是:

这导致:

异常:检查模型目标时出错:预期 timedistributed_1 的形状为 (None, 4, 24) 但得到的数组的形状为 (100, 3, 24)

问题似乎出在定义TimeDistributed 图层时。

如何定义TimeDistributed层以便编译和训练?

0 投票
2 回答
1970 浏览

machine-learning - 如何在 Keras 的 Convolution2D 中设置初始权重?

添加 Convolution2D 层的语法是 Keras 是 https://keras.io/layers/convolutional/#convolution2d。我无法正确传递“权重”参数。我该怎么做?

0 投票
0 回答
2165 浏览

caffe - Caffe 和 Keras 的区别

我已经使用Caffe为 MNIST训练了LeNet,现在我想导出这个模型以在Keras中使用。

为此,我尝试从 caffe.Net 中提取权重并使用它们来初始化 Keras 的网络。但是,我从两个模型中得到了不同的预测。所以我尝试逐层调试,从第一个开始。我测试过的代码如下:

我在图层构建中做错了吗?或者 Caffe 和 Keras 以不同的方式实现了 convolution2D?

0 投票
3 回答
58345 浏览

tensorflow - 如何在keras中堆叠多个lstm?

我正在使用深度学习库 keras 并尝试堆叠多个 LSTM,但没有运气。下面是我的代码

上面的代码在第三行返回错误Exception: Input 0 is incompatible with layer lstm_28: expected ndim=3, found ndim=2

输入 X 是一个形状为 (100,250,50) 的张量。我在 tensorflow 后端运行 keras

0 投票
0 回答
527 浏览

tensorflow - Keras 或 Matconvnet 中的局部卷积

我是实施 CNN 的新手。我对 Keras 和 Matconvnet 有一些经验。我正在尝试实现论文的区域层:DRML network for AU detection,如下所示:- 在此处输入图像描述

在这里,Region 层中 64 个过滤器的输入是 conv1 输出的不同部分,如下图所示。(2, 2) 和 (7, 3) 映射到不同的过滤器。

据我所知,到目前为止,Keras 和 matconvnet 中还没有这样的支持,如果有的话,我想知道如何实现它。基本上过滤器应该在它的一部分而不是整个输入特征图上运行。我怎样才能做到这一点 ?

0 投票
1 回答
3684 浏览

padding - keras中大小大于1的填充

据我所知,keras border_mode用于填充。我需要知道如何Padding/border_mode=2在 keras 中指定一个值?问题是border_mode只取两个值:那么validsame什么帮助吗?

ps已经问过数据科学。但可能是测试版所以没有回应:(

0 投票
8 回答
56545 浏览

python - Reset weights in Keras layer

I'd like to reset (randomize) the weights of all layers in my Keras (deep learning) model. The reason is that I want to be able to train the model several times with different data splits without having to do the (slow) model recompilation every time.

Inspired by this discussion, I'm trying the following code:

However, it only partly works.

Partly, becuase I've inspected some layer.get_weights() values, and they seem to change. But when I restart the training, the cost values are much lower than the initial cost values on the first run. It's almost like I've succeeded resetting some of the weights, but not all of them.

0 投票
1 回答
294 浏览

convolution - 如何使用 1 个输入和 2 个通道输出(回归)进行 CNN(图像)?

我从 Keras 开始,我需要实现某种类型:具有 1 个通道输入和 2 个通道作为输出的 CNN 都是回归?

0 投票
1 回答
2725 浏览

theano - 需要在多对多场景中使用 LSTM 澄清 TimeDistributed(dense())

我是 RNN 和 keras 的新手。

我正在尝试在顺序数据(不一定是时间序列,而是按顺序)上比较 LSTM 与传统机器学习算法(如 RF 或 GBM)的性能。我的数据包含 276 个预测变量和一个输出(例如,具有 276 个股票公司各种信息的股票价格)和 8564 个追溯观察。由于 LSTM 在捕捉顺序趋势方面非常出色,我决定使用 300 的 time_step。从下图中,我相信我的任务是创建一个多对多网络(左起最后一个图)。(图片: http: //karpathy.github.io/2015/05/21/rnn-effectiveness/

在此处输入图像描述

每个粉色盒子的大小为 276(预测变量数)和 300(time_steps)这样的粉色盒子在一批中。但是,我很难看到我如何在这里设计蓝色盒子,因为每个蓝色盒子都应该是输出(股票价格) 每个实例。从 Keras gihub 论坛#2403#2654上的其他帖子来看,我想我必须实现 TimeDistributed(Dense()) 但我不知道如何。这是我检查它是否有效的代码(train_idv 是要预测的数据,train_dv 是股票价格)

运行 model.fit 会出现此错误

回溯(最后一次调用):文件“”,第 1 行,在文件“/home/user/.local/lib/python2.7/site-packages/keras/models.py”中,第 627 行,适合 sample_weight= sample_weight)文件“/home/user/.local/lib/python2.7/site-packages/keras/engine/training.py”,第 1052 行,适合 batch_size=batch_size)文件“/home/user/.local/ lib/python2.7/site-packages/keras/engine/training.py”,第 983 行,在 _standardize_user_data exception_prefix='model target') 文件“/home/user/.local/lib/python2.7/site-packages /keras/engine/training.py",第 111 行,在 standardize_input_data str(array.shape)) 异常:检查模型目标时出错:预期 timedistributed_4 的形状为 (1, 300, 300) 但得到的数组的形状为 (8263, 300, 1)

现在,我已经成功地使用 time_step=1 运行它,并且只使用 Dense(1) 作为最后一层。但我不确定我应该如何塑造我的 train_dv(训练中的输出)或如何正确使用 TimeDistributed(Dense())。最后,我想使用

预测任何数据的分数。

我也在keras github 论坛上发布了这个问题。