设置:我需要存储与字符串对关联的特征向量。字符串-字符串对编码输入-输出关系。将有相对较少数量的输入X
(例如 5),并且对于每个输入x
,将有相对较少数量的输出Y|x
(例如 10)。
问题是,什么数据结构最快?
其他相关信息:
- 每个输入的输出通常不同,并且不能假设每个输入
X
具有相同数量的输出。 - 查找将进行“很多”次(可能是 1000 次)。
- 输入将被同样频繁地采样,但对于每个输入,通常会频繁访问一个或两个输出,其余的将不经常访问或根本不访问。
目前我在考虑三种可能:
- list-of-lists:使用索引访问外部列表(表示输入
X[i]
),使用索引访问内部列表(表示输出Y[i][j]
)。 - hash-of-hashes:与上面相同。
- 平散列:
key = (input,output)
。