我正在使用 python 和多个库(如 pandas 和 scipy)来准备数据,以便开始更深入的分析。例如,出于准备目的,我正在创建具有两个日期差异的新列。
我的代码提供了预期的结果,但速度很慢,所以我不能将它用于具有 80K 行的表。运行时间大约需要。80分钟的表只为这个简单的操作。
问题肯定和我的写作操作有关:
tableContent[6]['p_test_Duration'].iloc[x] = difference
此外,python 提供了一个警告:
日期差异的完整代码示例:
import time
from datetime import date, datetime
tableContent[6]['p_test_Duration'] = 0
#for x in range (0,len(tableContent[6]['p_test_Duration'])):
for x in range (0,1000):
p_test_ZEIT_ANFANG = datetime.strptime(tableContent[6]['p_test_ZEIT_ANFANG'].iloc[x], '%Y-%m-%d %H:%M:%S')
p_test_ZEIT_ENDE = datetime.strptime(tableContent[6]['p_test_ZEIT_ENDE'].iloc[x], '%Y-%m-%d %H:%M:%S')
difference = p_test_ZEIT_ENDE - p_test_ZEIT_ANFANG
tableContent[6]['p_test_Duration'].iloc[x] = difference