2

我想编写一个流量生成器,它可以复制正在运行的计算机对内存的原始读写需求。

但是运行中的计算机在它们的内存引用中也显示出(非常强的)局部性,并且在 64 位地址空间中,只有很小范围的地址会被引用(事实上,我已经在一个基准测试和大约 9000 页的数十亿页中进行了测试)报价被感动)。

什么是建模这种稀疏概率密度函数的好方法(理想情况下在 C 或 C++ 中) - 我有基准的概率,但不需要太密切地遵循它们(因为我可以在任何情况下使用基准参考但是想要更灵活的东西)。

为了澄清,我也有关于每个页面应该有多少读取的数据,但我感兴趣的是选择页面序列。(评论中建议的马尔可夫链想法可能是这样做的方法)

4

1 回答 1

1

对于它的价值,我决定使用一个非常粗略的技巧 - 沿着这些思路:选择一个介于 1 和 0 之间的随机数,在分布中找到频率/概率等于或大于这个数字的元素(选择最小概率此集合中的所有元素)。似乎有效(我在 R 中做了这个)

于 2014-07-19T12:01:23.680 回答