就增加(自定义)性能计数器的速度而言,我理解性能计数器是无锁的处理器原语。我怀疑这意味着它们可以在几十个 CPU 周期内执行——这意味着它们非常快,几乎不可能进行基准测试。正确的?
关于创建自定义性能计数器的内存消耗,我从一位同事那里听说,每个计数器需要大约 128kb 或更多(来自全局共享或单独的共享内存)。我不敢相信这个数字。这没有什么意义。我也许可以相信 2k 到 8k,但我想知道是否有人对此有更准确的信息?
就增加(自定义)性能计数器的速度而言,我理解性能计数器是无锁的处理器原语。我怀疑这意味着它们可以在几十个 CPU 周期内执行——这意味着它们非常快,几乎不可能进行基准测试。正确的?
关于创建自定义性能计数器的内存消耗,我从一位同事那里听说,每个计数器需要大约 128kb 或更多(来自全局共享或单独的共享内存)。我不敢相信这个数字。这没有什么意义。我也许可以相信 2k 到 8k,但我想知道是否有人对此有更准确的信息?