我的数据集中有调查的 21 个不同部分的开始时间和结束时间。我想计算每个调查的结束时间和开始时间之间的差异,并将该数据放在调查特定列中。
开始时间和结束时间为 HH:MM:SS
这是我的实现:
def getSec(s):
l = s.split(':')
return int(l[0]) * 3600 + int(l[1]) * 60 + int(l[2])
...将 csv 导入 dataFrame 后,我做
timeDifferences = {}
sections =['1','2','3','4','5','6','7_1','7_2','7_3','8_1','8_2','8_3','9_1','9_2','9_3','11_1','11_2','12','15','16','17','18_1','18_2','19','21']
for i in sections:
timeDifferences["s"+i+"_time"] = (getSec(df["s"+i+"_etimestamp"]) - getSec(df["s"+i+"_stimestamp"]))* 60
问题是我在整个系列上做 getSec,而不是单个数据集。我是 Pandas 的新手,所以我无法概念化如何同时处理整个数组。
如果没有三个嵌套的 for 循环,我将如何做到这一点?