我被要求为不是很技术的听众做一个关于聚类算法的讲座。考虑到这一点,我想做一个简单的练习,让观众从数据集中识别组。但是,我找不到可用于此目的的好的数据集。
是否有我可以用于此目的的客户数据集和他们购买的一些产品?或任何其他可能看起来合适的数据集!
我被要求为不是很技术的听众做一个关于聚类算法的讲座。考虑到这一点,我想做一个简单的练习,让观众从数据集中识别组。但是,我找不到可用于此目的的好的数据集。
是否有我可以用于此目的的客户数据集和他们购买的一些产品?或任何其他可能看起来合适的数据集!
我可以建议一个简单的地理位置数据库,例如德国的所有城市。我想你可以免费找到它。或者您可以查找 NASA 的天空数据。集群也很好。
这是包含 4 个月交易的 Ta-Feng 数据集。从春南教授本人那里得到的。它现在存储在我的 dropbox 文件夹中:https ://www.dropbox.com/s/tsd5zd8a7afmzs7/D11-02.ZIP?dl=0每个文件的第一行以中文显示列名。英文是:日期;会员卡ID;产品分类; 产品代码; 数量; 总交易金额(新台币)