我正在使用 AWS 机器学习回归来预测餐厅排队等候的时间,在特定的工作日/时间。今天我有大约 800k 数据。
示例数据:
restaurantID (rowID)weekDay (categorical)time (categorical)tablePeople (numeric)waitingTime (numeric - target)
1 sun 21:29 2 23
2 fri 20:13 4 43
...
我有两个问题:
1)我应该将时间用作分类还是数字?最好分成两个字段:分钟和秒?
2)我想在同一个模型中得到我所有餐厅的预测。
示例:我希望发送 rowID 标识符,它会根据每个餐厅数据(忽略其他数据)返回不同的预测。
我试过了,但它对任何 rowID 都返回相同的预测。为什么?
我应该为每家餐厅建立一个模型吗?