我有一个 .csv 文件,其中包含每个地层的地质构造和化石物种的出现。每个化石在 .csv 文件中都有自己的行,地层名称包含在该行中。
我在下面编写的代码可以很好地打印出编队出现的次数。
import csv
from collections import Counter
out=open("BivalviaGRDWIS.csv", "rb")
data=csv.reader(out)
data.next()
data=[row for row in data]
out.close()
formations = []
for row in data:
if row[13]=='':
continue
else:
formations.append(row[13])
print Counter(formations)
但是,可能有重复的化石名称会破坏计数;我只想要每个地层中独特化石的数量。我可以添加什么来计算 .csv 文件中单个列的一部分中的唯一元素,而不是所有元素?