问题标签 [mlp]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
27 浏览

tensorflow - model.prediction() 由于形状不匹配而失败

tf.keras我使用新版本训练了一个简单的 MLP 模型2.2.4-tf。这是模型的样子:

在此处输入图像描述

当我尝试进行预测时出现错误prediction_result = model.predict(test_data, batch_size=138)。的test_data形状为(69, 28),因此它小于batch_size138 的形状。这是错误,似乎问题来自第一个 dropout 层:

相同的解决方案在旧版本的 keras (2.2.4) 和 tensorflow (1.12.0) 中没有问题。我该如何解决这个问题?我没有更多数据用于测试,所以我无法更改 test_data 集以拥有更多数据点!

0 投票
0 回答
284 浏览

performance - 我的测试错误可以低于验证错误但高于训练错误吗?

我正在尝试具有 5 个隐藏节点的多层感知器。然而,测试误差低于验证误差,高于训练误差。测试集的相关系数也高于验证集的相关系数。这可以接受吗?我已经包括了回归和性能图。在我看来,概括是可以的;不是最好的,但足够了。

在此处输入图像描述

在此处输入图像描述

这是一个 ANN-GARCH 类型的波动率模型。

0 投票
1 回答
211 浏览

python - 计算 Keras MLP 的每个模型层的参数

我正在尝试关注这篇关于如何为每一层计算参数的SO 帖子,有人可以给我一个提示吗?

这是我的输出model.summary()

在此处输入图像描述

这是模型:

0 投票
1 回答
273 浏览

python - BiLSTM(双向长短期记忆网络)和 MLP(多层感知器)

我正在尝试使用 Bidirectional Long Short-Term Memory Networks 实现这篇论文的网络架构在广播电视中的说话人变化检测,作者是 Ruiqing Yin、Herve Bredin、Claude Barras,即在此处输入图像描述

该模型由两个 Bi-LSTM(Bi-LSTM 1 和 2)和一个多层感知器 (MLP) 组成,其权重在整个序列中共享。B. Bi-LSTM1 有 64 个输出(32 个前向和 32 个后向)。Bi-LSTM2 有 40 个(每个 20 个)。全连接层分别为 40 维、10 维和 1 维。前向和后向 LSTM 的输出被连接起来并前馈到下一层。共享的 MLP 由三个全连接的前馈层组成,前两层使用 tanh 激活函数,最后一层使用 sigmoid 激活函数,以输出 0 到 1 之间的分数。我参考了各种来源并提出以下代码,

我对 TimeDistributed 层感到困惑,它如何模拟 MLP,以及如何共享权重,您至少可以指出我做对与否。

0 投票
1 回答
5202 浏览

python - 调整 MLPRegressor 超参数

我一直在尝试调整 MLP 模型的超参数以解决回归问题,但我总是收到收敛警告。

这是我的代码

我得到的警告是

我的数据集中有 87 个特征和 1384 行,都是数字的,并且已经使用 MinMaxScaler 进行了缩放。如果您能指导我调整超参数,我将不胜感激。

0 投票
0 回答
103 浏览

python-3.x - 为什么我的 MLP ROC_AUC 只绘制 3 个点

我正在尝试获得 ROC 曲线,但我的代码似乎正在绘制一个三角形。我想我做错了什么。我将不胜感激。

你能否回顾一下并建议我能做什么。尽管我并不惊讶我有一个三角形,因为如果我看看我的 fpr 和 tpr,只有 3 个值,我不明白为什么。我希望有更多的值会导致曲线。

我看到有人遇到了与此相同的挑战,但该解决方案似乎对我不起作用,因为我希望 fpr 和 tpr 返回超过 3 个值。

0 投票
1 回答
506 浏览

python - Keras:MLP 的结果很好,但双向 LSTM 的结果很差

Keras我用aMLP和 a训练了两个神经网络Bidirectional LSTM

我的任务是预测句子中的单词顺序,因此对于每个单词,神经网络必须输出一个实数。当处理一个包含 N 个单词的句子时,将输出中的 N 个实数排序,以获得表示单词位置的整数。

我在数据集上使用相同的数据集和相同的预处理。唯一不同的是,在LSTM数据集中我添加了填充以获得相同长度的序列。

在预测阶段,LSTM我排除了从填充向量创建的预测,因为我在训练阶段屏蔽了它们。

MLP架构:

双向 LSTM 架构:

使用 LSTM 可以更好地解决该任务,它应该可以很好地捕获单词之间的依赖关系。

但是,用MLP我取得了很好的成绩,但用LSTM的结果却很糟糕。

由于我是初学者,有人能理解我的LSTM架构有什么问题吗?我快疯了。

提前致谢。

0 投票
1 回答
1163 浏览

python - sklearn 的 MLP predict_proba 函数在内部是如何工作的?

我试图了解sklearnMLP 分类器如何为其predict_proba功能检索其结果。

该网站仅列出:

概率估计

而许多其他的,例如逻辑回归,有更详细的答案:概率估计。

所有类的返回估计值按类标签排序。

对于 multi_class 问题,如果 multi_class 设置为“多项式”,则 softmax 函数用于查找每个类的预测概率。否则使用one-vs-rest 方法,即使用逻辑函数计算每个类假设它为正的概率。并在所有类中标准化这些值。

其他模型类型也有更多细节。以支持向量机分类器为例

还有这篇非常不错的 Stack Overflow 帖子,它深入解释了它。

计算 X 中样本的可能结果的概率。

模型需要在训练时计算概率信息:拟合属性概率设置为 True。

其他例子

随机森林

预测 X 的类别概率。

输入样本的预测类别概率计算为森林中树木的平均预测类别概率。一棵树的类概率是叶子中同一类的样本的分数。

高斯过程分类器:

我希望了解与上述帖子相同的内容,但对于MLPClassifier. 内部工作如何MLPClassifier

0 投票
1 回答
2828 浏览

python - AttributeError:“MLPClassifier”对象没有属性“best_loss_”

我在 scikit-learn 的 MLPClassifier 中试验了 warm_start 参数。但是,我在运行以下代码时收到错误消息。

以下是我的输出和错误消息。第一个 clf.fit() 能够运行完成,但第二个 clf.fit() 在 1 次迭代后产生错误消息。

如果我更改为warm_start = False,则 clf.fit() 都能够运行完成。

0 投票
2 回答
57 浏览

keras - 我应该如何在 keras 模型中修复输入大小

我想使用 keras 用 MLP 实现 MNIST,一开始我只使用 2 层,但我得到了错误:“expected activation_9 有 3 个维度,但是得到了形状为 (60000, 10) 的数组”。我该如何解决它?**

**