我需要对多变量时间序列数据进行建模,以预测很少为 1 的二进制目标(不平衡数据)。这意味着我们要建模基于一个特征是二元(爆发),很少是1?所有功能都是二进制的,很少 1. 建议的解决方案是什么?
该特征对基于以下成本函数的成本函数有影响。如果成本与以下相同,我们想知道是否准备好。
问题定义: 基于爆发的模型,很少出现 1。
准备或不准备避免疾病的爆发,爆发的成本是准备的20倍
每天的成本(第二天):成本=20*爆发*!准备+准备
型号:准备(准备第二天)为哪几天爆发?
问题:
建立一个模型来预测疫情?
报告每年的成本估算
csv 文件已上传,数据用于当天结束 csv 文件包含行,每行是一天,具有不同的特征,其中一些是二进制的,最后一个特征是爆发,很少是 1,是考虑成本的主要特征。