0

例如,我有一个这样的 n 人的数据集

userID 1 (or 2,3.....up to n)
gender male (or female)
working yes (or No)
income >$5000/month (or <$5000)
have_car yes (or no)

我想根据其他属性(性别、工作和收入)来预测一个人是否拥有汽车。我应该使用什么格式进行培训,我应该投入多少人进行培训,如果假设我有 10,000 人的数据来测试有多少人

4

1 回答 1

0

格式:您必须使用数字数据。因此使用可以使用 0 和 1 进行二进制判定。

培训/测试:没有确切的公式。您似乎没有很多用于分类的功能 - 这意味着您不一定需要大量的训练数据。您可以一开始就将其拆分为 50:50,然后检查您是否获得了合理的结果。

于 2012-06-02T12:04:36.190 回答