我有一个关于客户购买模式的大约 100,000 条记录的数据集。数据集包含
- 年龄(从 2 到 120 的连续值)但我也计划将其分类为年龄范围。
- 性别(0 或 1)
- 地址(只能是六种或者我也可以用1到6的数字来表示)
- 偏好商店(只能来自 7 家商店)这是我的班级问题。
所以我的问题是根据客户的年龄、性别和位置对偏好商店进行分类和预测。我曾尝试使用朴素树和决策树,但它们的分类准确率在下面有点低。
我也在考虑逻辑回归,但我不确定性别和地址等离散值。但是,我也假设 SVM 有一些内核技巧,但还没有尝试过。
因此,您建议使用哪种机器学习算法来提高这些功能的准确性。