经过一些数据预处理后,我坚持合并数据集。我想要做的是根据相同的批次号将同一列下的所有日期按行顺序合并。通常它是堆叠的数据,然后我根据流程步骤(40,42,50)进行了堆叠。那么我的意图是将两列的时间差作为分钟。
数据集:
process 40-------------------42-----------------------50
index batch
64177 699042 NaT------------------2019-01-10 18:28:05-------NaT
171272 699042 NaT------------------NaT-------------------- 2019-01-10 18:28:20
120655 699042 2019-01-10 17:40:09--NaT----------------------NaT
120656 699043 2019-01-10 17:40:09--NaT----------------------NaT
67362 699043 NaT------------------2019-01-10 20:43:25-------NaT
168373 699043 NaT------------------NaT-----------------------2019-01-10 20:43:33
我想要的是:
process 40-------------------42-----------------------50
batch
699042 2019-01-10 17:40:09-----2019-01-10 18:28:05-------2019-01-10 18:28:20
699043 2019-01-10 17:40:09----2019-01-10 20:43:25-------2019-01-10 20:43:33