我一直在研究自组织地图的概念,以了解任何类型数据集中的变量/关系并生成一些热图。是否有任何其他机器学习概念/方法可用于对数据进行探索性分析并获得变量之间的关系。
问问题
1554 次
1 回答
5
没有“最佳”技术来可视化数据。但是存在许多算法可以让您对数据有不同的看法。SOM 属于一类称为非线性降维的技术。维基百科列出了 26 种此类技术。
我从您的个人资料中看到您正在使用 Python,因此我建议您查看scikit-learn 文档。他们实现了很多这样的算法。一个相当流行的算法是t-SNE,它是在考虑可视化的情况下创建的。有关许多流行数据集的结果,请参阅示例部分。
最后,您不必将自己局限于此类方法。它们在处理高维数据时非常好,但如果不是你的情况,更简单的方法会很好用。任何聚类算法都可用于执行探索性数据分析。
于 2015-12-02T15:13:07.500 回答