我有以下格式的条目(总共约 8800 万):
userid age test value
111 33 SODIUM 140
111 34 POTASSIUM 4.1
333 65.4 CHLORIDE 107
444 24 BICARBONATE 24
value
给定前三个项目(即,,,),我需要为最后一列userid
创建age
快速查找test
。
重复查找此数据的最佳方法是什么?我正在考虑的一个是创建一个字典,其中keys
是 元组 ( userid
, age
, test
) 和值是value
。过去我使用过类似的方法,这种方法在小得多的数据上非常慢。