我目前正在研究我的论文项目,设计一个缓存实现以与最短路径图算法一起使用。图算法与运行时相当不一致,因此对整个算法进行基准测试太麻烦了。我必须只专注于对缓存进行基准测试。
我需要进行基准测试的缓存大约是一个Map
接口的十几个实现。这些缓存旨在与给定的访问模式(从上面的算法中查询密钥的顺序)很好地配合使用。然而,在一个“小”问题的给定运行中,有几千亿个查询。我需要运行几乎所有这些,才能对基准测试的结果充满信心。
我在将数据加载到内存时遇到了概念问题。可以创建一个查询日志,它只是在一次算法运行中查询的所有键(它们是 10 个字符的字符串标识符)的磁盘有序列表。这个文件很大。我的另一个想法是将日志分成 1-5 百万个查询块,并以下列方式进行基准测试:
- 加载 1-5 百万个密钥
- 将开始时间设置为当前时间
- 按顺序查询它们
- 记录经过的时间(当前时间 - 开始时间)
我不确定这会对缓存产生什么影响。我怎样才能进行热身期?加载文件可能会清除 L1 或 L2 缓存中最后一个块的所有数据。此外,维护一个 1-5 百万元素的字符串数组有什么影响(甚至迭代它会扭曲结果)?
请记住,访问模式很重要!例如,有一些哈希表具有移动到前端启发式,它重新排序表的内部结构。多次运行单个块或无序运行块是不正确的。这使得预热 CPU 缓存和 HotSpot 变得更加困难(我还可以保留一个用于预热但不用于计时的辅助虚拟缓存)。
拥有庞大数据集的微基准测试有哪些好的做法?