我正在使用 Python 和 Pandas。我正在做一个预测性维护项目,我的目的是预测在给定时间段内发生的故障概率,比如 4-6 小时。我已经对数据进行了预处理并将其简化为以下内容:数据集有 4 个属性,开始时间、结束时间、事件的持续时间(这是开始时间和结束时间的差异)和第四个属性是事件,它是失败与否失败。(1为失败,0为不失败)样本数据如下:
START_TIME END_TIME DURATION_MINUTES EVENT
2/15/2018 2:32 2/15/2018 2:32 0.566666667 0
2/15/2018 2:32 2/15/2018 2:33 0.916666667 0
2/15/2018 2:33 2/15/2018 2:33 0.116666667 1
2/15/2018 2:33 2/15/2018 2:35 1.283333333 0
2/15/2018 2:35 2/15/2018 2:35 0.083333333 0
2/15/2018 2:35 2/15/2018 2:35 0.166666667 0
2/15/2018 2:35 2/15/2018 2:35 0 0
我有大约 120000 个数据实例。谁能告诉我如何可视化和预测在任何一天(4 小时的时间范围)发生故障(事件 = 1)的概率