问题标签 [dimensionality-reduction]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 循环降维?
我想要降维,使其返回的维度是圆形的。
例如)如果我将 12d 数据减少到 2d,在 0 和 1 之间归一化,那么我希望 (0,0) 与 (.9,.9) 一样接近 (.1,.1)。
我的算法是什么?(python实现的奖励积分)
PCA给了我二维数据平面,而我想要数据的球面。
说得通?简单的?固有问题?谢谢。
r - 在 R 中对其应用 pca 后减少数据集的维度
我的问题是如何使用使用 R 获得的主成分。
一旦你得到主成分,我们如何使用它来减少维度?我有一个包含 6 个变量的数据集,我需要使用 k-means 对其进行聚类。当我对 6 个变量进行聚类时,K-means 给了我一个散点图。我认为 pca 可以帮助减少维度,因此 k-means 可以产生丰硕的结果。
我这样做是为了获得主要成分:
请指导我如何进一步降低数据集的维度。
matlab - Matlab:聚类中的问题
我需要对使用 k-means 聚类的多维数据集数据集执行降维。数据包含从放置在触觉手套上的传感器的传感器读数获得的正实数和负实数。数据是在表示一个动作时捕获的,比如将字母“A”表示为
现在,我的困惑是
- 我没有使用以下代码对多维数据进行任何聚类
如何纠正这个问题?有什么问题?
在获得所有维度的集群后,我现在通过集群标签将数据表示为
1 1 3 2
等等。
- 这些数据是否包含事件的时间顺序?通过一目了然,但有论文说聚类不考虑时间顺序。
- 我需要减少它的长度。我知道主成分分析,但它用于选择维度并且不会减少数据长度。使用传入的测试数据集使用这种简化的格式进行基于距离的分类是否合理?
matlab - 如何仅获得 MATLAB 中的第一个主成分?
对于某些测量,我只需要从矩阵中获取第一个主成分的数值。有人可以告诉我该怎么做吗?
machine-learning - Isomap 比 MDS 更快
在 Scikit-Learn 实现中,Isomap 算法在 S-Curve 数据集上运行得比多维缩放更快,如此处所示。在算法的第三阶段,实现使用了部分特征值分解,而不是研究人员提出的 MDS 版本。
我对部分特征值分解如何与 MDS 完成相同的工作有点迷茫。任何人都可以对此有所了解吗?
python - scikit-learn 中文本数据的监督降维
我正在尝试使用 scikit-learn 对自然语言数据进行一些机器学习。我已经将我的语料库转换为词袋向量(采用稀疏 CSR 矩阵的形式),我想知道 sklearn 中是否有监督降维算法能够获取高维、监督数据并进行投影它进入一个较低维度的空间,该空间保留了这些类之间的差异。
高级问题描述是我有一个文档集合,每个文档上都可以有多个标签,我想根据文档的内容预测哪些标签会被贴在新文档上。
在其核心,这是一个使用 BoW 向量的稀疏表示的有监督、多标签、多类问题。sklearn 中是否有可以处理此类数据的降维技术?人们在处理 scikit-learn 中的受监督的 BoW 数据时是否使用过其他类型的技术?
谢谢!
matlab - 聚类在分割和归约中的应用
我有一个多维时间序列数据,它们是动作识别的特征。我有 20 个变量代表 3D 关节位置、四元数值、平均值、关节之间的欧式距离。我已经应用了 k=4 的 kmeans 聚类。聚类后,我想将同时出现的集群 id 组合在一起,以便与它们对应的数据点也被该集群 id 组合在一起。例如,考虑 10 个数据样本的以下集群索引,
让数据如下,其中 A,B,C,D,E,F,G,H 是 3 个特征变量,其中 (AC) 表示特定关节的 (x,y,z) 坐标,D 表示欧几里得关节相对于头部的距离,(EH) 是关节的四元数值。让数值为元素。Data =
然后,结果将是一个缩减的向量(数据的压缩版本),其中前 2 行数据将由集群 id 1 表示,第 3 行数据由集群 id 2 表示,第 4 行 = 1,第 5、第 6 和第 7 行行将被组合并由第 3,8th 和第 9 行 2 和最后一行 4 表示。因此,最终的数据表示成为一个压缩字符串,其维度和长度也减少了:Compressed_Data = [1 2 1 3 2 4]'
。如何进行此映射和转换?先感谢您。
machine-learning - 卡在特征脸上,PCA
我正在使用特征脸实现人脸识别迷你项目。
我成功地拥有了计算机并将特征脸保存到一个文件夹中。使用:
然后将它们保存到文件中。
我的下一步应该是什么?我究竟如何降低维数,然后用它来识别给定的脸是否与另一个相似?
python - 我怎样才能找到一个投影来保持内积的相对价值?
我想用 100 维向量 v 进行降维,然后得到一个 10 维向量 v'。
并且必须保留以下属性:
我了解到随机投影是一种方法(http://scikit-learn.org/stable/modules/random_projection.html),但它保留了距离和内积的值。但我只想保留相对 > 或 < 属性,而不是绝对距离/内积值。
随机投影的另一个问题是它适合大尺寸减少(10000-3000)。
下面是我的 Python 伪代码来解释我需要什么:
matlab - 在 Matlab 中使用 PCA 降低训练数据的维数
这是一个后续问题:
为了对新的 10 维测试数据进行分类,我是否也必须将训练数据减少到 10 维?
我试过了:
但是使用带有这个和 10 维测试数据的分类器会产生非常不可靠的结果?有什么我在做根本错误的事情吗?
编辑: