问题标签 [feature-selection]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
opencv - OpenCV:如何使用不同视角的真实场景图像比较特征检测器和提取器的性能?
我正在尝试构建一个闭环算法,但在开始开发之前,我想测试哪个特征描述符在真实数据集上工作得更好。
我有两张双向拍摄的走廊图像,一张进入房间,另一张离开同一个房间。因此它们代表相同的场景,但来自 2 个不同(相反)的观点。
我正在使用 OpenCV,并且已经为检测器、提取器和匹配器编写了代码。
但是现在看结果我发现有很多错误的匹配。我怎样才能放下它们?我尝试使用 cv::FindFoundamentalMat 但我不确定这是否是正确的方法。
编辑
我发现这篇论文 ( ShmidtJAMRIS12 ) 完全符合我的想法,但我无法理解他们如何选择每个检测器和提取器的参数
memory-management - glmulti 超大候选集
错误信息:
SYSTEM:win7/64bit/ultimate/16gb-real-ram加虚拟内存,memory.limit(32000)
- 这个错误信息是什么意思?
在 glmulti(y = "y", data = mydf, xr = c("x1", : !Oversized 候选集。
mydf 有 3.6 毫米的行和 150 列的浮点数
- 在 glmulti 中采取哪些措施来解决它?
- R世界中glmulti的任何替代品?
R/64bit“好运动”
matlab - 用于特征融合的 CCA
在一些多模态识别方法中,他们使用典型相关分析 (CCA) 将两个输入特征向量融合为一个单一且也是低维的特征向量。Matlab 已经有 CCA 的代码: [A,B,r,U,V] = canoncorr(X,Y); 见: http: //www.mathworks.com/help/stats/canoncorr.html
我想知道如何使用此函数达到最终(融合)特征向量。有人可以解释这些步骤或建议参考吗?
opencv - Viola-Jones 检测器中每个特征的使用频率和位置是多少?
这是关于Viola-Jones 算法(用于人脸检测)的问题,如此处所述
http://en.wikipedia.org/wiki/Viola%E2%80%93Jones_object_detection_framework
在原始论文中
http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.110.4868
我的问题是:
- 他们描述了 3 种特征。并给出 4 个功能示例。每个 24x24 窗口计算的功能这么多?3 还是 4?或者他们是否使用了这 4 个功能的所有可能大小?(会很多)
- 显然,其中一项功能可以出现在该 24x24 窗口的不同位置。那么有多少次,在什么确切位置?
- 它们描述了 3 种分类器,但显然它们可以进行很多修改(比如 A 旋转为 B)。翻转或反转分类器 D 也是有意义的。他们是只使用这 4 种类型,还是以多种方式修改所有这些类型?
feature-detection - Active frame extraction from motion capture
I am new to this area - I have a background in a Gait and Posture.
I have a series of motion files of timestamped coordinates (containing X, Y, and Z in mm) with a number of joints (30).
What would be the simplest way to extract the following from the motion observations. 1) The number of active features (i.e. active joints). 2) average speed of motion.
Same file is the format of NxP. Where P is the number of joints and N is the number of frame observations.
What I am looking for is some pointers into possible areas to explore.
Regards,
Dan
machine-learning - 文档聚类/分类中的功能?
这听起来可能很幼稚,但我只是想确定在机器学习术语中说话时,文档聚类中的特征是从文档中选择的词,如果在词干提取后丢弃一些词或作为停用词。
我正在尝试使用 LibSvm 库,它说对于不同类型的 { no_of_instances, no_of_features } 有不同的方法。
就像 no_of_instances 远低于 no_of_features 一样,线性内核就可以了。如果两者都很大,线性会很快。但是,如果 no_of_features 很小,则非线性内核更好。
因此,对于我的文档聚类/分类,我有少量文档,例如 100 个,每个文档可能有大约 2000 个单词。所以我属于小型 no_of_instances 和大型 no_of_features 类别,具体取决于我认为的特征是什么。
我想对文档使用 tf-idf。
那么 no_of_features 是我从 tf-idf 得到的向量的大小吗?
feature-selection - 计算机视觉中的“词袋”和“特征袋”有什么区别?
研究该主题,可以找到作者使用“词袋”模型进行图像分类/检索的论文,而其他人使用“特征袋”模型进行类似任务的论文。
尽管我对所涉及的方法有基本的了解(检测和提取视觉词,构建视觉词典,使用机器学习训练分类器),但我仍然看不出两种模型之间的区别。它们是同义词吗?也许我错过了显示差异的具体示例/文档......
machine-learning - SVM如何计算文档分类中测试文档的tf-df?
在我的 SVM 中,我在文档上使用 tf-idf 进行特征提取。这些 tf-idf 是在整个训练文档上计算的。
现在,当我得到一个要分类的测试文档时,如何为它生成向量?
我在计算 tf-idf 之前使用了词干提取。我也可以在测试文档上执行该操作。我有 count_of_words 用于火车文件。
我应该增加训练文档 count_of_words 中的单词数来计算测试文档的 tf-idf 还是应该直接使用它?
r - 一种具有连续值特征的特征选择算法POE1ACC
我想实现“错误概率和平均相关系数”的算法。(更多信息第 143 页。这是一种从一组特征中选择未使用特征的算法。据我所知,该算法不限于布尔值特征,但我不知道如何将其用于连续特征。
这是我能找到的关于这个算法的唯一例子:
因此,X 是要预测的特征,C 是任何特征。为了计算 C 的错误概率值,他们选择与绿色部分不匹配的值。因此 C 的 PoE 为 (1-7/9) + (1-6/7) = 3/16 = 1875。
因此,我的问题是:我们如何使用连续特征而不是布尔特征来计算 PoE?还是不可能?
classification - 人脸检测的特征提取
我需要从一组面部图像中设计(提取)8 个特征(参见下面的 url)。
http://faculty.ucmerced.edu/mhyang/face-detection-survey_files/face-sample.gif
这些图像是在多个原始图像上移动窗口(具有固定大小)的结果。然后使用包含提取特征值和类标签的训练集训练一个朴素贝叶斯分类器。
那么我应该从图像中提取哪些特征呢?有人可以给我一些例子吗?