问题标签 [supervised-learning]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
3824 浏览

machine-learning - 神经网络中的时间序列提前预测(N Point Ahead Prediction)大规模迭代训练

(N=90) 使用神经网络进行点前预测:

我试图预测提前 3 分钟,即提前 180 分。因为我将时间序列数据压缩为每 2 个点的平均值为 1,所以我必须预测 (N=90) 超前预测。

我的时间序列数据以秒为单位。数值在 30-90 之间。它们通常从 30 移动到 90 和从 90 移动到 30,如下例所示。

在此处输入图像描述

我的数据可以来自:https ://www.dropbox.com/s/uq4uix8067ti4i3/17HourTrace.mat

我在实现神经网络来预测 N 个点时遇到了麻烦。我唯一的特点是以前。我使用了 elman 循环神经网络和 newff。

在我的场景中,我需要提前预测 90 个点。首先,我如何手动分离输入数据和目标数据:例如:

直到它到达数据的末尾

我在 Elman 循环神经网络中有 100 个输入点和 90 个输出点。什么是最有效的隐藏节点大小?

//在我的训练开始时,我用卡尔曼过滤它,归一化到[0,1]的范围内,然后我打乱了数据。1)我将无法训练我的完整数据。首先,我尝试训练完整的 M 数据,大约 900,000,这并没有给我一个解决方案。

2)其次,我尝试迭代训练。但是在每次迭代中,新添加的数据都会与已经训练过的数据合并。在 20,000 个训练数据之后,准确性开始下降。首先训练的 1000 个数据完全适合训练。但是当我开始迭代合并新数据并继续训练后,训练准确率下降得非常快,从 90 到 20。例如。

这种方法非常缓慢,过了一段时间它不会给出任何好的结果。

我的第三种方法是迭代训练。它与之前的训练类似,但在每次迭代中,我只训练数据的 1000 部分,而不与之前训练的数据进行任何合并。例如,当我训练前 1000 个数据时,直到它达到 >95% 的最小误差准确性。在它被训练之后,当我对数据的第二个 1000 部分做了同样的事情时;它会覆盖权重,并且预测器主要表现为数据的最新训练部分。

训练数据:此图是我训练过的训练集的快照,蓝线是原始时间序列,红线是经过训练的神经网络的预测值。MSE 在 50 左右。

在此处输入图像描述

测试数据:在下图中,您可以看到我使用神经网络对测试数据的预测,该网络使用 20,000 个输入点进行训练,同时保持训练数据集的 MSE 误差 <50。它能够捕捉到很少的模式,但大多数情况下我并没有给出真正好的准确性。

在此处输入图像描述

我无法成功使用任何这种方法。在每次迭代中,我还观察到 alpha 的微小变化会完全覆盖已经训练的数据,并且更多地关注当前训练的数据部分。我无法想出解决这个问题的办法。在迭代训练中,我应该保持较小的学习率和尽可能少的时期数。

而且我找不到一种有效的方法来预测时间序列中提前 90 个点。任何关于我应该做什么以预测 N 点的建议,任何教程或信息链接。

迭代训练的最佳方式是什么?在我的第二种方法中,当我达到 15000 个训练数据时,训练规模突然开始下降。我应该迭代地更改运行时的 alpha 吗?

==========

任何建议或我做错的事情将不胜感激。

我还实现了循环神经网络。但是在大数据的训练中,我遇到了同样的问题。是否可以在循环神经网络中为(newelm)进行自适应学习(在线学习)?重量不会自行更新,我没有看到任何改善。

如果是,怎么可能,我应该使用哪些功能?

0 投票
2 回答
1391 浏览

neural-network - 可以用带标签的训练集训练神经网络,并用不带标签的数据集对其进行测试吗?

我有一个问题一直困扰着我。我可以用带标签的数据集(即:带有目标信息的数据集)训练神经网络,然后应用另一个没有标签的数据集吗?

我想用我拥有的示例训练网络,但在实际情况下希望它对示例进行分类(没有关联的目标)。例如:

训练集:

测试集 (没有目标,其实就是我想知道的)

假设预测必须是蓝色的。

我正在使用快速矿工来测试神经网络,但我很快就明白我无法应用这个测试集,因为它错过了标签。

那我该如何解决我的问题呢?我想知道我是否需要针对这个问题探索无监督神经网络,但老实说我不这么认为。

亲切的问候。

0 投票
2 回答
386 浏览

algorithm - 人类可解释的监督机器学习算法

我正在寻找一种有监督的机器学习算法,它可以产生透明的规则或定义,可以很容易地被人类解释。

我使用的大多数算法(SVM、随机森林、PLS-DA)都不是很透明。也就是说,您很难在针对非计算机科学家读者的出版物中以表格形式总结模型。作者通常做的是,例如,发布基于某些标准的重要变量列表(例如,基尼指数或 RF 情况下的平均准确性下降),有时通过指出这些变量的不同之处来改进此列表有问题的班级之间。

我正在寻找的是一个相对简单的样式输出“如果(任何变量 V1-V10 > 中值或任何变量 V11-V20 < 第一四分位数)和变量 V21-V30 > 第三四分位数,然后是 A 类”。

周围有这样的吗?

只是为了限制我的问题:我正在处理高度多维的数据集(数万到数十万个通常共线的变量)。因此,例如回归树不是一个好主意(我认为)。

0 投票
1 回答
98 浏览

r - 用负数表示一个类,用于 R 中的 GBM 训练

我已经生成了一个约 1GB 的巨大训练文件,其中基本事实是 4 个类 {-1,0,1,2} 之一。是的,我同意我可以使用 3 而不是 -1 来完成它,但出于某些传统原因,我使用了 -1。

我想在多项分布模式下使用 gbm。它是否会产生负面表示的一些问题,或者我可以继续它?

0 投票
0 回答
141 浏览

machine-learning - 是否可以在递归神经网络中进行自适应学习(在线学习)?

是否可以在(newelm)的递归神经网络中进行自适应学习(在线学习)?重量不会自行更新,我没有看到任何改进。

如果是,怎么可能,我应该使用哪些功能?

0 投票
1 回答
228 浏览

algorithm - How can we use a machine learning algorithm on this type of data?

Here is the scenario:

We have a website with the capability for students to create an e-portfolio, which is like a profile page combined with your projects you can add to it.

For each student portfolio we are going to have an educator review the portfolio and give it a set of scores based on the content of the portfolio. So a set of scores which will be summed to a total score will be associated with each students portfolio.

So we have score data, associated with portfolio data and we want to use this data as supervised training data for a machine learning algorithm. So then the computer can examine thousands of these cases, looks for patterns, provide insight and be able to predict scores for other portfolios.

Here is the data we are collecting for each person:

We plan to collect thousands of students portfolios and scores over time. What kind of algorithm could we use to analyze this data to find correlation between portfolios that received similar scores? Then use this data to predict how successful a portfolio will be once a student has filled it out. Please let me know if any of this is confusing or if you need more information, thanks so much!

0 投票
1 回答
1267 浏览

matlab - 如何使用超过 3 个类别的混淆矩阵计算 FAR FRR Accuray?

我有一个 20x20 的混淆矩阵。如何计算代表完整系统的 FAR、FRR、准确度和精度值?不是针对每个班级,而是针对整个系统。

0 投票
4 回答
4446 浏览

python - 使用 Python 的字符串子序列内核和 SVM

如何使用子序列字符串内核 (SSK) [Lodhi 2002] 在 Python 中训练 SVM(支持向量机)?

0 投票
1 回答
82 浏览

machine-learning - 自动学习集群

嗨完整的新手问题:我有一个由两列组成的表。第一列属于“箱”,由果蝇居住的地方编码。第二列是 0 或 1,分别是中性和真正像糖。我有两个问题?

1)如果我怀疑只有一个变量,那就是他们居住的地方决定了他们是否喜欢糖。有没有办法让我的计算机只分成 2 个集群?所有喜欢糖和中性的垃圾箱。这样我们就可以做进一步的实验来确定这些垃圾箱是什么。

2) 自动确定可能有多少集群驱动了这种行为?例如,可能有 4 个变量(4 个集群)可以确定糖偏好的结果。

如果这是微不足道的,请道歉。下表列出。谢谢!

0 投票
2 回答
73 浏览

classification - 康奈尔大学的 SVM-pref 软件包

我正在使用 SVM-pref ( http://svmlight.joachims.org ) 来解决二进制分类问题。我对这个包没有太多经验,所以我就以下问题寻求帮助:

(1) 我的特征都是离散的/名义的。是否有一种特殊的方法来表示特征向量,例如将标称值转换为连续值的特殊方法,还是我们只是替换 1、2、3 等虚拟数字的标称值?

(2) 如果第一个问题的答案是我们用虚拟数字替换名义值,那么我的第二个问题是我们从 1 开始对特征值进行编号,所以我们有 1:1 但不是 1:0,否则学习者会认为零 -价值特征不存在。那是对的吗?

(3) 我们如何配置最佳的 -c 值和其余参数的值?仅仅是通过错误和试验,还是他们使用其他方法来决定这些参数?