问题标签 [novelty-detection]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
3174 浏览

machine-learning - 机器学习——一类分类/新奇检测/异常评估?

我需要一个满足以下要求的机器学习算法:

  • 训练数据是一组特征向量,都属于同一个“正”类(因为我不能产生负数据样本)。
  • 测试数据是一些可能属于或不属于正类的特征向量。
  • 预测应该是一个连续值,应该表示与正样本的“距离”(即0表示测试样本明显属于正类,1表示明显负,但0.3表示有点正)

一个例子:假设特征向量是二维特征向量。

正向训练数据:

  • (0, 1), (0, 2), (0, 3)

测试数据:

  • (0, 10) 应该是一个异常,但不是一个明显的异常
  • (1, 0) 应该是异常,但“等级”高于 (0, 10)
  • (1, 10) 应该是一个异常,具有更高的异常“等级”
0 投票
1 回答
576 浏览

svm - 一类 SVM 的新奇检测替代方案

我有一个需要检测数据集中异常的情况。我没有带标签的训练集。这个问题也不是完全没有监督的,因为我知道部分数据不包含异常,而且我知道那是哪一部分。据我所知,这称为新奇检测。一类 SVM 可以在这里工作,但我想将它与其他方法进行比较。

到目前为止,我只发现了完全无监督或完全有监督的方法,因此对于我的新奇检测案例,没有一类 SVM 的有效替代方案。有谁知道有效的替代方法(最好在 Python 中可用)?

0 投票
1 回答
111 浏览

python - 了解图像是否与用于训练卷积神经网络的数据集相关的有效方法

目前我正在使用 VGG16 + Keras + Theano 认为迁移学习方法来识别植物类。它工作得很好,给了我很好的准确性。但我要解决的下一个问题是找到一种方法来识别输入图像是否包含植物。我不想让另一个分类器来做这件事,因为它不是很有效。

所以我做了一些搜索,发现我们可以从最新的模型层(激活层之前)获取激活并对其进行分析。

从上面的代码中我注意到,当我们有非常不相关的图像时,激活的神经元数量比包含植物的图像要大:

  1. 对于用于模型训练的图像,激活的神经元数量为 19%-23%
  2. 对于包含未知植物物种的图像 20%-26%
  3. 对于不相关的图像 24%-28%

了解与百分比值相关的图像是否相交并不是一个很好的功能。

那么,有没有解决这个问题的好方法呢?

0 投票
1 回答
190 浏览

r - R 使用哪种算法来计算一类 SVM?(包 e1071)

R 使用哪种算法来计算一类 SVM?这是功能

我发现了这个非常不错的博客,作者在其中写了关于一类 SVM 的两种算法。提到的功能使用哪一个?

0 投票
1 回答
46 浏览

svm - 如何训练一类 svm 多次

我有一个多类数据集,并试图用来OneClassSVM()对每个类进行分类。

所以我想知道如何OneClassSVM()在每节课上进行训练?

0 投票
1 回答
13 浏览

machine-learning - 如何减少图像异常检测中的误报?

我目前正在从事一个质量检测项目,我需要开发一个可以检测不规则零件的程序。我面临的问题是我没有很多不规则样本(3,000 多个常规样本只有七个)。我尝试使用 CNN,但由于模型检测到的样本数量不平衡,所以我正在探索的方法是使用异常检测算法。我也尝试过使用自动编码器,但由于规则和不规则之间的差异很小,我无法得到任何好的结果。到目前为止,给我最好结果的方法是结合局部异常因子和特征提取器 (HOG)。这个唯一的问题是,即使在调整算法的参数之后,它仍然会给我误报(正常样本被标记为不规则样本),这对于此应用程序是不可接受的。我可以在流程中添加什么来消除误报吗?o 你能推荐我其他方法吗?我真的很感激任何帮助:)