我希望您能帮助我使用#Python。
我有这个数据集:
E 1 1999-02-28 b,g,f jjj:12,bbb:3,ddd:9,ggg:8,hhh:2
A 2 1999-10-28 a,f,c,d ccc:2,ddd:0,aaa:3,hhh:9
我需要在列表中获取 b,g,f 和 a,f,c,d 的序列。我尝试使用模式[az],[az]的多种组合,但是每次跳过最后一项时,我都不知道如何概括得到序列。
输出应如下所示:
[b,g,f]
[a,f,c,d]
数据集来自一个 csv 文件,我正在阅读这样的内容:
with open("data.csv", "r") as file:
lines = file.readlines()
然后使用 for 循环读取行:
list_sequence = []
for i in lines:
a = re.findall(pattern= '???' , string=str(i))
list_sequence.append(b)
在问号中,是我需要找到模式的地方。