4

这段代码似乎有效,但我是否正确使用了 InterlockedIncrement 函数?m_count 的正确内存对齐是我最关心的问题。假设我们在 x86-64 系统上并编译一个 64 位应用程序(以防万一)。顺便说一句,出于我的实际目的,我不能将 m_count 声明为 volatile long 然后使用 InterlockedIncrement(&m_count); 但它必须是指向堆中数据的指针。

#include <Windows.h>
#include <malloc.h>

class ThreadSafeCounter {
public:
    ThreadSafeCounter()
    {
        // Are those arguments for size and alignment correct?
        void* placement = _aligned_malloc( sizeof(long), sizeof(long) );
        m_count = new (placement) long(0);
    }
    ~ThreadSafeCounter()
    {
        _aligned_free( const_cast<long*>(m_count) );
    }

    void AddOne()
    {
        InterlockedIncrement(m_count);
    }

    long GetCount()
    {
        return *m_count;
    }

private:
    volatile long* m_count;
};
4

3 回答 3

6

堆分配器已经将返回的地址与本机平台字长对齐。x86 为 4 个字节,x64 为 8 个字节。您在 MSVC 的任一平台上使用long 32 位。无需跳过 _aligned_malloc() 箍。

于 2010-12-01T13:27:10.413 回答
3

这是一个平台架构细节,但您需要记住,原子操作不仅仅是对齐。平台 ABI 通常会确保默认情况下原始数据类型对齐,以便任何操作(包括原子操作)都可以工作。malloc() 永远不应返回未对齐的指针,即使您要求一个字节也不行。

尽管除此之外,请特别注意http://en.wikipedia.org/wiki/False_sharing - 这意味着除了需要对齐(通常是 a sizeof(long))之外,您还必须确保只托管一个原子访问的变量在同一个缓存行中。

如果您计划使用/允许这些计数器的数组,这一点尤其重要。

Microsoft 的编译器__declspec(align(value))用于指示编译器保证特定的结构对齐。正如其他人所提到的,似乎没有特别需要对这样的数据结构/类进行堆分配,但我不知道您是否需要 pimpl 来做其他事情。

于 2010-12-01T12:18:38.673 回答
1

为您的用例做的最简单的事情是通过继承使用侵入式引用计数,从而消除了这种需要。

但是,如果您不顾一切,只需查看 MSVC 的 shared_ptr 实现即可。

    typename aligned_storage<sizeof(_Ty),
        alignment_of<_Ty>::value>::type _Storage;
    };
    _Ty *_Getptr() const {  // get pointer
        return ((_Ty *)&_Storage);
    }

那个C-cast很讨厌。但是,这向我表明,这个对象肯定会具有正确的对齐方式,利用类型特征。

于 2010-12-01T12:44:25.477 回答