问题标签 [feature-selection]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
3588 浏览

opencv - 如何使用 HOG 检测单个身体部位

信息:

我想使用 OpenCV 的 HOG 检测来识别可以在各种方向看到的对象。唯一的问题是,我似乎无法找到一个合理的特征检测器或分类器来以旋转和缩放不变的方式检测这一点(正如前臂等物体所需要的那样)。

前期工作:

让我们专注于本次讨论的前臂。前臂可以有多个方向,主要的不同特征可能是它的轮廓边缘。前臂图像可能指向图像中的任何方向,因此很复杂。到目前为止,我已经对使用 HOG 描述符来解决这个问题进行了一些深入的研究,但我发现在我的正面训练集中前臂产生的各种姿势在实际图像中产生非常低的检测分数。我怀疑问题是每个正图像产生的梯度在保存到直方图中时不会产生非常一致的结果。我已经查看了许多关于该主题的研究论文,试图解决或即兴解决这个问题,包括来自 Dalal & Triggs [链接] 的原件:http://lear.inrialpes.fr/people/triggs/pubs/Dalal-cvpr05.pdf似乎检测整个人类的假设并不一定适用于检测个体特征(特别是假设所有人类都站起来似乎表明 HOG 不是像前臂那样进行旋转不变检测的好方法)。

笔记:

如果可能的话,我想避开任何非自由的解决方案,例如那些与 Sift、Surf 或 Haar 有关的解决方案。

问题:

检测图像中旋转和缩放不变对象的好的解决方案是什么?特别是对于这个例子,什么是检测图像中前臂所有方向的好解决方案?

0 投票
1 回答
1695 浏览

pca - 使用 PCA 进行特征选择

数据集由 N 个元素和 K 个变量组成。使用 PCA 我可以减少变量的数量,但是如何从 K 个变量中检查哪些提供了最多的信息?

例如我有这样的数据集:

我知道第 1 列与第 2 列相同,第 4 列由关系确定:2*1st+5*3rd-5。因此,第 1 列和第 3 列提供的信息最多,其余列不提供任何附加信息。但是如何使用 PCA 计算呢?

0 投票
1 回答
1205 浏览

algorithm - 为特征选择实现向后贪心

我正在尝试应用具有 1700 个特征和 3300 个实例的数据集的特征选择。特征选择的方法之一是逐步回归。这是一种贪心算法,在每一轮中删除最差的特征。

我使用数据在 SVM 上的性能作为指标来找出最差的特征。第一次,我训练 SVM 1700 次,每次只保留一个特征。在此迭代结束时,我从集合中删除了该特征,该特征的删除导致了最高的 SVM 性能。所以我们现在剩下 1699 个特征。

第二次,我训练了 SVM 1699 次,每次都保留一个特征,以此类推。

如果我想将数据集减少到 100 个特征,那么这个程序将训练一个 SVM(1700!-100!)次。这是棘手的。有关如何避免此类问题的任何建议?

0 投票
2 回答
2560 浏览

java - 自然语言处理 - 文本分类功能

所以我正在尝试使用 Weka SVM 对文本进行分类。到目前为止,我用于训练 SVM 的特征向量是由训练文本中出现的一元和二元的 TF-IDF 统计数据组成的。但是,我从测试经过训练的 SVM 模型中得到的结果根本不准确,那么有人可以就我的程序给我反馈吗?我正在按照以下步骤对文本进行分类:

  1. 构建由从训练文本中提取的一元和二元组成的字典
  2. 计算每个 unigram/bigram 在每个训练文本中出现的次数,以及 unigram/bigram 在训练文本中出现的次数
  3. 使用步骤 2 中的数据计算每个 unigram/bigram 的 TF-IDF
  4. 对于每个文档,构造一个作为字典长度的特征向量,并将相应的 TF-IDF 统计量存储在向量的每个元素中(例如,文档一的特征向量中的第一个元素将对应于 TF -IDF 字典中与文档相关的第一个单词)
  5. 给每个特征向量附加类标签,以区分哪个文本属于哪个作者
  6. 使用这些特征向量训练 SVM
  7. 测试文本的特征向量的构建方式与训练文本相同,并由 SVM 进行分类

另外,我是否需要用更多功能训练 SVM?如果是这样,在这种情况下哪些功能最有效?任何帮助将不胜感激,谢谢。

0 投票
1 回答
1038 浏览

machine-learning - 使用weka对传感器数据进行分类

我正在研究一个分类问题,它有不同的传感器。每个传感器收集一组数值。

我认为这是一个分类问题,并希望使用 weka 作为 ML 工具来解决这个问题。但是我不确定如何使用 weka 来处理输入值?哪个分类器最适合这个问题(特征的一个实例是一组数值)?

例如,我有三个传感器 A、B、C。我可以定义从所有传感器收集的 5 个数据作为一个实例吗?例如,A 的一个实例是{1,2,3,4,5,6,7},B 的一个实例是{3,434,534,213,55,4,7)。C{424,24,24,13,24,5,6}。

非常感谢您花时间审查我的问题。

0 投票
1 回答
14041 浏览

r - R中的支持向量机特征选择示例

我正在尝试使用 R 包在 SVM 中应用特征选择(例如递归特征选择)。我已经安装了支持 LibSVM 中的特征选择的 Weka,但我还没有找到任何关于 SVM 或类似语法的示例。一个简短的例子会有很大的帮助。

0 投票
0 回答
135 浏览

image - 图像分类中每个类别的特征选择

我必须在大量图像上做一个图像分类器(基于已经提取的特征),同时我必须为每个类检索最相关的特征。我在网上找到了很多关于“特征选择”的论文,但那是为整组图像提取最相关的特征,这不是我感兴趣的。那么,我该怎么做呢?

0 投票
1 回答
1388 浏览

javascript - 用于搜索覆盖像素的所有 OpenLayers 矢量特征的 JavaScript 函数

我有一个在矢量图层中绘制特征的OpenLayers 地图。这些功能是可选的,并且在选择时会弹出一个弹出窗口。不幸的是,在很多情况下,功能重叠,因此不可能选择某些功能。我认为解决此问题需要做的是更改我的选择控件,以便它使用单击处理程序并此时在地图上搜索功能。我需要编写什么样的函数?以前有没有这样的例子?

这是绘制特征的方式:

这就是当前选择图层的方式:

这是我计划使用的点击事件监听器:

0 投票
1 回答
55 浏览

machine-learning - 监督学习

问题是关于结合检测器的输出概率。我的每个检测器 d_i 都给了我场景中物体存在的概率 p_i。我有一个标记的数据集,我想学习检测器的加权组合以获得(更准确的)全局检测器。

我可以使用哪些算法来解决此类问题?我想比较不同的方法。作为第一步,权重可以是固定的学习值。然后,例如根据时间上下文使它们自适应会很好。

感谢您的想法。

0 投票
1 回答
271 浏览

database - Leaflet draw: Keep limit editable objects, database consistency, make multi objects

Im planning to use Leaflet Draw as part of a special wiki with an embedded map. Users should be able to draw geo-objects that are related to one or more pages in the wiki. As the wiki-pages the objects are saved in a database and can be modified by every user. Problems:

  1. How can i limit the number of editable objects to only one at a time?

  2. How to keep the database consistent if two users are editing the same object at the same time?

  3. How can i generte multi-objects/combine several objects (e.g. polygons) to a super-object (multi-polygon)?

  4. Does anybody know some similiar approches to my idea? Thanks.