第一个问题是如何有效地在工作日循环。一个干净的解决方案是使用itertools.cycle()
.
以下将生成重复工作日的无限序列。
import itertools
weekdays = ['Sat','Sun','Mon','Tue','Wed','Thu','Fri']
itertools.cycle(weekdays)
zip()
当最短的输入迭代用完时,该函数将停止。现在我们有一个无限的工作日序列,最短的输入将是八千行数据。
>>> import itertools
>>> weekdays = ['Sat','Sun','Mon','Tue','Wed','Thu','Fri']
>>> data = [(2000, 1, 1, 1, 336), (2000, 1, 1, 2, 335), (2000, 1, 1, 1, 334),
(2000, 1, 1, 2, 333), (2000, 1, 1, 1, 332), (2000, 1, 1, 2, 331),
(2000, 1, 1, 1, 330), (2000, 1, 1, 2, 329), (2000, 1, 1, 1, 328),
(2000, 1, 1, 2, 327)]
>>> list(zip(data, itertools.cycle(weekdays)))
[((2000, 1, 1, 1, 336), 'Sat'), ((2000, 1, 1, 2, 335), 'Sun'),
((2000, 1, 1, 1, 334), 'Mon'), ((2000, 1, 1, 2, 333), 'Tue'),
((2000, 1, 1, 1, 332), 'Wed'), ((2000, 1, 1, 2, 331), 'Thu'),
((2000, 1, 1, 1, 330), 'Fri'), ((2000, 1, 1, 2, 329), 'Sat'),
((2000, 1, 1, 1, 328), 'Sun'), ((2000, 1, 1, 2, 327), 'Mon')]
最后,为了在内部元组中获取工作日,我们可以在列表推导中创建新的元组。
>>> [t + (day,) for t, day in zip(data, itertools.cycle(weekdays))]
[(2000, 1, 1, 1, 336, 'Sat'), (2000, 1, 1, 2, 335, 'Sun'),
(2000, 1, 1, 1, 334, 'Mon'), (2000, 1, 1, 2, 333, 'Tue'),
(2000, 1, 1, 1, 332, 'Wed'), (2000, 1, 1, 2, 331, 'Thu'),
(2000, 1, 1, 1, 330, 'Fri'), (2000, 1, 1, 2, 329, 'Sat'),
(2000, 1, 1, 1, 328, 'Sun'), (2000, 1, 1, 2, 327, 'Mon')]
这里,t
是每行数据关联的元组,day
是星期几,语法t + (day,)
创建一个新的元组,由数据元组和星期几组合而成。