21

我有运行循环的线程。我需要该循环每 5 毫秒运行一次(1 毫秒错误)。我知道 Sleep() 函数并不精确。

你有什么建议吗?

更新。我不能这样做。在循环结束时,我需要某种睡眠。我也不想加载 100% 的 CPU。

4

5 回答 5

27

我一直在寻找适合实时应用的轻量级跨平台睡眠功能(即高分辨率/高精度和可靠性)。以下是我的发现:

调度基础

放弃 CPU 然后将其取回是昂贵的。根据这篇文章,调度程序延迟在 Linux 上可能在 10-30 毫秒之间。因此,如果您需要以低于 10 毫秒的精度进行睡眠,那么您需要使用特殊的操作系统特定 API。通常的 C++11 std::this_thread::sleep_for 不是高分辨率睡眠。例如,在我的机器上,快速测试表明,当我要求它只休眠 1ms 时,它通常会休眠至少 3ms。

Linux

最流行的解决方案似乎是 nanosleep() API。但是,如果您想要 < 2ms 的高分辨率睡眠,则还需要使用 sched_setscheduler 调用来设置线程/进程以进行实时调度。如果您不这样做,则 nanosleep() 就像过时的睡眠一样,其分辨率约为 10 毫秒。另一种可能性是使用警报

视窗

这里的解决方案是按照其他人的建议使用多媒体时间。如果你想在 Windows 上模拟 Linux 的 nanosleep(),下面是方法(原始参考)。同样,请注意,如果您在循环中调用 sleep(),则不需要一遍又一遍地执行 CreateWaitableTimer()。

#include <windows.h>    /* WinAPI */

/* Windows sleep in 100ns units */
BOOLEAN nanosleep(LONGLONG ns){
    /* Declarations */
    HANDLE timer;   /* Timer handle */
    LARGE_INTEGER li;   /* Time defintion */
    /* Create timer */
    if(!(timer = CreateWaitableTimer(NULL, TRUE, NULL)))
        return FALSE;
    /* Set timer properties */
    li.QuadPart = -ns;
    if(!SetWaitableTimer(timer, &li, 0, NULL, NULL, FALSE)){
        CloseHandle(timer);
        return FALSE;
    }
    /* Start & wait for timer */
    WaitForSingleObject(timer, INFINITE);
    /* Clean resources */
    CloseHandle(timer);
    /* Slept without problems */
    return TRUE;
}

跨平台代码

这是为 Linux、Windows 和 Apple 平台实现睡眠的time_util.cc 。但是请注意,它没有像我上面提到的那样使用 sched_setscheduler 设置实时模式,所以如果你想使用 <2ms 那么这是你需要额外做的事情。您可以进行的另一项改进是避免在某个循环中调用 sleep 时一遍又一遍地调用 Windows 版本的 CreateWaitableTimer。有关如何执行此操作,请参见此处的示例

#include "time_util.h"

#ifdef _WIN32
#  define WIN32_LEAN_AND_MEAN
#  include <windows.h>

#else
#  include <time.h>
#  include <errno.h>

#  ifdef __APPLE__
#    include <mach/clock.h>
#    include <mach/mach.h>
#  endif
#endif // _WIN32

/**********************************=> unix ************************************/
#ifndef _WIN32
void SleepInMs(uint32 ms) {
    struct timespec ts;
    ts.tv_sec = ms / 1000;
    ts.tv_nsec = ms % 1000 * 1000000;

    while (nanosleep(&ts, &ts) == -1 && errno == EINTR);
}

void SleepInUs(uint32 us) {
    struct timespec ts;
    ts.tv_sec = us / 1000000;
    ts.tv_nsec = us % 1000000 * 1000;

    while (nanosleep(&ts, &ts) == -1 && errno == EINTR);
}

#ifndef __APPLE__
uint64 NowInUs() {
    struct timespec now;
    clock_gettime(CLOCK_MONOTONIC, &now);
    return static_cast<uint64>(now.tv_sec) * 1000000 + now.tv_nsec / 1000;
}

#else // mac
uint64 NowInUs() {
    clock_serv_t cs;
    mach_timespec_t ts;

    host_get_clock_service(mach_host_self(), SYSTEM_CLOCK, &cs);
    clock_get_time(cs, &ts);
    mach_port_deallocate(mach_task_self(), cs);

    return static_cast<uint64>(ts.tv_sec) * 1000000 + ts.tv_nsec / 1000;
}
#endif // __APPLE__
#endif // _WIN32
/************************************ unix <=**********************************/

/**********************************=> win *************************************/
#ifdef _WIN32
void SleepInMs(uint32 ms) {
    ::Sleep(ms);
}

void SleepInUs(uint32 us) {
    ::LARGE_INTEGER ft;
    ft.QuadPart = -static_cast<int64>(us * 10);  // '-' using relative time

    ::HANDLE timer = ::CreateWaitableTimer(NULL, TRUE, NULL);
    ::SetWaitableTimer(timer, &ft, 0, NULL, NULL, 0);
    ::WaitForSingleObject(timer, INFINITE);
    ::CloseHandle(timer);
}

static inline uint64 GetPerfFrequency() {
    ::LARGE_INTEGER freq;
    ::QueryPerformanceFrequency(&freq);
    return freq.QuadPart;
}

static inline uint64 PerfFrequency() {
    static uint64 xFreq = GetPerfFrequency();
    return xFreq;
}

static inline uint64 PerfCounter() {
    ::LARGE_INTEGER counter;
    ::QueryPerformanceCounter(&counter);
    return counter.QuadPart;
}

uint64 NowInUs() {
    return static_cast<uint64>(
        static_cast<double>(PerfCounter()) * 1000000 / PerfFrequency());
}
#endif // _WIN32

另一个更完整的跨平台代码可以在这里找到

另一个快速解决方案

您可能已经注意到,上面的代码不再是轻量级的。它需要包含 Windows 标头以及其他内容,如果您正在开发仅标头库,这可能不是非常理想的。如果您需要少于 2 毫秒的睡眠并且您不太热衷于使用操作系统代码,那么您可以使用以下简单的解决方案,它是跨平台的,并且在我的测试中运行良好。请记住,您现在没有使用经过高度优化的操作系统代码,这可能会更好地节省电力和管理 CPU 资源。

typedef std::chrono::high_resolution_clock clock;
template <typename T>
using duration = std::chrono::duration<T>;

static void sleep_for(double dt)
{
    static constexpr duration<double> MinSleepDuration(0);
    clock::time_point start = clock::now();
    while (duration<double>(clock::now() - start).count() < dt) {
        std::this_thread::sleep_for(MinSleepDuration);
    }
}

相关问题

于 2017-01-25T22:10:30.153 回答
18

不要在这里使用旋转。使用标准方法可以达到要求的分辨率和准确度。

Sleep()当系统中断周期设置为以该高频率运行时,您可以使用大约 1 ms 的周期。查看Sleep() 的描述以获取详细信息,特别是具有获取和设置定时器分辨率的多媒体定时器以获取有关如何设置系统中断周期的详细信息。如果实施得当,这种方法可获得的准确度在几微秒范围内。

我怀疑你的循环也在做其他事情。因此,我怀疑您需要 5 ms 的总时间,这将是Sleep()您在循环中其他事情上花费的时间和其余时间的总和。

对于这种情况,我建议使用Waitable Timer Objects,但是,这些计时器也依赖于多媒体计时器 API 的设置。我在这里概述了更高精度计时的相关功能。在这里可以找到对高精度计时的更深入了解。

要获得更准确和可靠的计时,您可能需要查看process priority classesthread priorities。关于 Sleep() 准确性的另一个答案是this

然而,能否获得Sleep()精确 5 ms 的延迟取决于系统硬件。某些系统允许您以每秒 1024 次中断运行(由多媒体计时器 API 设置)。这对应于 0.9765625 ms 的周期。因此,您可以获得的最接近的是 4.8828125 毫秒。其他允许更接近,特别是自 Windows 7 以来,在提供high resolution event timers. 请参阅MSDN 中的关于计时器和高精度事件计时器

总结:设置多媒体定时器以最大频率运行并使用等待定时器

于 2012-11-15T12:50:54.693 回答
9

从问题标签我想你在窗户上。看看Multimedia Timers,他们宣传的精度低于 1 毫秒。另一种选择是使用自旋锁,但这基本上会使 cpu 核心保持最大使用率。

于 2012-11-15T12:42:39.507 回答
4

也许您可以尝试使用循环来检查时间间隔并在时间差为 5 毫秒时返回,而不是使用睡眠。循环应该比睡眠更准确。

但是,请注意,精度并不总是可能的。cpu 可能会在如此小的间隔内与另一个操作捆绑在一起,并且可能会错过 5 毫秒。

于 2012-11-15T12:34:31.187 回答
2

这些功能:

让您创建一个分辨率为 100 纳秒的可等待计时器,等待它,并让调用线程在触发时执行特定函数。

这是使用所述计时器的示例

请注意,WaitForSingleObject 有一个以毫秒为单位的超时,这可能可以作为等待的粗略替代品,但我不相信它。有关详细信息,请参阅此 SO问题

于 2012-11-16T08:37:11.120 回答