machine-learning - SVM（或其他 ML 模型）的预测准确度取决于特征的编码方式？

Question

假设对于一个给定的机器学习问题，我们有一个人拥有哪辆车的特征。我们可以通过以下方式之一对这些信息进行编码：

在我的实验中，当与 SVM 一起尝试时，第二种方法的性能比第一种方法好得多。

编码方式如何影响模型学习，有没有研究过编码影响的资源？或者我们是否需要进行命中和试验来检查它在哪里表现最好？

score 3 · Accepted Answer

第一种方法的问题是您使用任意数字来表示特征（例如 BMW=2 等），而 SVM 会认真对待这些数字，就好像它们有顺序一样：例如，它可能会尝试使用 CAR_OWNED>3 的用例预测。所以第二种方式更好。

score 1 · Accepted Answer

第 2.1 章分类特征：

如果您搜索“svm 分类特征”，您会发现更多

2 回答 2