Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我有一个大型数据库,其中包含有关国家名称、位置、HDI(人类发展指数)和人口等国家的数据。我需要根据人口将这些数据分为“K”个组。我的一位朋友建议,在这种情况下,K-means 集群将很有用。但我在想,这可以直接通过根据人口对数据进行排序然后将这些排序的数据分成组来完成。这两种方法有什么区别吗?
谢谢
沿一维递归拆分会产生决策树。这是一种不同的数据结构。组之间的所有切割都沿轴(水平或垂直)。K-means 可以实现平衡,因为切割不一定是水平或垂直的(大多数情况下不是)。
实际上,决策树方法也非常有用。你不妨试试看。