我有一个巨大的 CSV,其中每一行都有一个用户 ID。我想找到整个集合中出现频率最高的用户 ID。
我已经DictReader
从csv
模块中读取了 csv,因为我认为这对于以后操作单个记录最有用。
我找不到在我创建的字典中搜索键“UserID”的各种值并找到最常见值的方法。
任何帮助将不胜感激!
到目前为止,这是我的代码:
import csv
from time import time
start = time()
myData=open("myCSV.csv", "rb" )
csvReader= csv.DictReader(myData)
# declare counters
volume = 0
#sum all data usage
for data in csvReader:
volume += float(data["volume_total"])
print "Total : %f" %volume
#calculate processing time
elapsed = time() - start
print "Processing time: %f seconds" %elapsed