0

我的数据文件包含八千行,其中每一行都是一个元组。前两行是:

(2000, 1, 1, 1, 336)
(2000, 1, 1, 2, 335)

我想反复循环通过工作日并将工作日附加到每个数据元组。行列表应如下所示:

[(2000, 1, 1, 1, 336, 'Sat'), (2000, 1, 1, 2, 335, 'Sun'), ...]

我尝试了不同的方法,并且设法获得了几乎所有可能的组合,除了所需的组合。我无法完全理解我误解的内容。

代码

weekdays = ['Sat','Sun','Mon','Tue','Wed','Thu','Fri']    
a = read_file('VIK_sealevel_2000.txt')
zipp = list(zip(a, weekdays))
print(zipp[0:2])   

输出

[((2000, 1, 1, 1, 335), 'Sat'), ((2000, 1, 1, 2, 336), 'Sun')]
4

2 回答 2

2

第一个问题是如何有效地在工作日循环。一个干净的解决方案是使用itertools.cycle().

以下将生成重复工作日的无限序列。

import itertools

weekdays = ['Sat','Sun','Mon','Tue','Wed','Thu','Fri']
itertools.cycle(weekdays)

zip()当最短的输入迭代用完时,该函数将停止。现在我们有一个无限的工作日序列,最短的输入将是八千行数据。

>>> import itertools
>>> weekdays = ['Sat','Sun','Mon','Tue','Wed','Thu','Fri']
>>> data = [(2000, 1, 1, 1, 336), (2000, 1, 1, 2, 335), (2000, 1, 1, 1, 334), 
            (2000, 1, 1, 2, 333), (2000, 1, 1, 1, 332), (2000, 1, 1, 2, 331), 
            (2000, 1, 1, 1, 330), (2000, 1, 1, 2, 329), (2000, 1, 1, 1, 328), 
            (2000, 1, 1, 2, 327)]
>>> list(zip(data, itertools.cycle(weekdays)))
[((2000, 1, 1, 1, 336), 'Sat'), ((2000, 1, 1, 2, 335), 'Sun'), 
 ((2000, 1, 1, 1, 334), 'Mon'), ((2000, 1, 1, 2, 333), 'Tue'), 
 ((2000, 1, 1, 1, 332), 'Wed'), ((2000, 1, 1, 2, 331), 'Thu'), 
 ((2000, 1, 1, 1, 330), 'Fri'), ((2000, 1, 1, 2, 329), 'Sat'), 
 ((2000, 1, 1, 1, 328), 'Sun'), ((2000, 1, 1, 2, 327), 'Mon')]

最后,为了在内部元组中获取工作日,我们可以在列表推导中创建新的元组。

>>> [t + (day,) for t, day in zip(data, itertools.cycle(weekdays))]
[(2000, 1, 1, 1, 336, 'Sat'), (2000, 1, 1, 2, 335, 'Sun'), 
 (2000, 1, 1, 1, 334, 'Mon'), (2000, 1, 1, 2, 333, 'Tue'), 
 (2000, 1, 1, 1, 332, 'Wed'), (2000, 1, 1, 2, 331, 'Thu'), 
 (2000, 1, 1, 1, 330, 'Fri'), (2000, 1, 1, 2, 329, 'Sat'), 
 (2000, 1, 1, 1, 328, 'Sun'), (2000, 1, 1, 2, 327, 'Mon')]

这里,t是每行数据关联的元组,day是星期几,语法t + (day,)创建一个新的元组,由数据元组和星期几组合而成。

于 2020-10-20T00:56:53.003 回答
1

要将工作日添加到每个元组中,请尝试使用:

a = [(2000, 1, 1, 1, 335), (2000, 1, 1, 2, 336)] # was read_file('VIK_sealevel_2000.txt')
weekdays = ['Sat','Sun','Mon','Tue','Wed','Thu','Fri']
zipp = [row[0] + (row[1],) for row in zip(a, weekdays)]

更新:

正如 Christopher Peisert 在另一个答案中所指出的那样,当行a数多于行数时,此答案是不正确的weekdays

于 2020-10-20T00:40:58.200 回答