0

我有个问题。我需要实现一个使用计时器和 SIGALRM 切换 ucontext 线程的程序,但是当我使用 evict_thread 函数切换线程时出现分段错误。我相信这是竞争条件的结果,因为它发生在程序执行期间的不同时间。这是我的 evict_thread

void evict_thread(int signal)
{   
// Check that there is more than one thread in the queue
if ((int)list_length(runqueue) > 1)
{
    // Remove the currently executing thread from the runqueue and store its id
    int evict_thread_id = list_shift_int(runqueue);

    // Place the thread at the back of the run queue
    list_append_int(runqueue, evict_thread_id);

    // Get the id of the thread that is now at the head of the run queue
    int exec_thread_id = list_item_int(runqueue, 0);

    // Set the start time for new thread to the current time
    clock_gettime(CLOCK_REALTIME, &thread_table[exec_thread_id]->start);

    printf("Switching context from %s to %s\n",
        thread_table[evict_thread_id]->thread_name,
        thread_table[exec_thread_id]->thread_name);

    // Execute the thread at the head of the run queue
    if (swapcontext(&thread_table[evict_thread_id]->context, &thread_table[exec_thread_id]->context) == -1)
    {
        perror("swapcontext failed\n");
        printf("errno: %d.\n", errno);
        return;
    }   
}
return;     
}

上述函数的调用方式如下

// Set the SIGALRM
if (sigset(SIGALRM, evict_thread) == -1)
{
    perror("sigset failed\n");
    printf("errno: %d.\n", errno);
    return;
}

// Initialize timer
thread_switcher.it_interval.tv_sec  = 0;
thread_switcher.it_interval.tv_usec = quantum_size;
thread_switcher.it_value.tv_sec = 0;
thread_switcher.it_value.tv_usec =  quantum_size;
setitimer(ITIMER_REAL, &thread_switcher, 0);

运行队列只是一个全局整数列表,它们是指向 ucontext 线程的全局指针表的索引。该列表是使用来自 libslack.org 的 C 通用实用程序库中的列表数据结构实现的

当我禁用计时器并让每个线程在切换上下文之前运行完成时,程序会正常运行,但是当线程在执行期间切换时,大约 80% 的时间会出现分段错误。

此外,当我尝试使用 gdb 回溯分段错误时,它说它发生在系统调用中。

4

3 回答 3

0

我不能就如何让它发挥作用给你任何建议,但这里有几点关于什么不起作用:

信号处理程序与您的其他代码异步运行。例如,当某些代码正在更新您runqueuelist_append_int(runqueue, evict_thread_id); .

printf()不应在信号处理程序中调用,它可能会死锁或更糟。 是在信号处理程序中可以安全调用的函数列表。没有提到在信号处理程序中调用 setcontext/swapcontext 是安全的,尽管它的 linux 手册页说您可以在信号处理程序中调用 setcontext() - 我不确定这有什么权威性。

另请注意 setcontext() 的联机帮助页中所说的内容:

当信号发生时,当前的用户上下文被保存,内核为信号处理程序创建一个新的上下文。

因此,当您发出 swapcontext() 时,您可能会保存信号处理程序的上下文,而不是在信号启动之前运行的当前上下文。

于 2013-03-14T00:04:24.660 回答
0

请记住,信号处理程序与您的主代码异步运行。该man 7 signal页面值得仔细阅读,以确保您遵守指南。例如,在该部分Async-signal-safe-functions中没有提及printf或其他功能,例如swapcontext. 这意味着您不能从信号处理程序可靠地调用这些函数。

一般来说,尽量在信号处理程序中做尽可能少的工作。通常这只是意味着sig_atomic_t在信号处理程序中设置一个类型的标志,然后在你的主循环中检查这个标志的状态。

也许重新排列您的代码,以便上下文切换发生在主循环中,而不是来自信号处理程序。您也许可以sigwait在主循环中使用来等待计时器信号。

于 2013-03-14T00:04:32.923 回答
0

作为猜测:您正在向内核传递一些从那里看不到的东西,因为您切换了上下文。您正在询问段错误,但您的代码正在做有趣的事情。

也许如果您考虑一个更标准的线程调度模型,您可以避免这些问题。除了尝试使用上下文切换来调度线程,还有其他方法可以做到这一点。您可以使用完全相同的当前程序模型从驱逐线程中调用它们。

其中一些建议是特定于系统的。如果您能告诉我们您的操作系统是什么,我们可以找到适合您情况的东西。或者你可以自己检查一下。

阅读有关 POSIX 线程调度的信息。请特别注意 SCHED_FIFO,它适用于您的模型。

https://computing.llnl.gov/tutorials/pthreads/man/sched_setscheduler.txt

这通常适用于使用 POSIX 线程库来调度线程,而不是你试图以艰难的方式去做。

于 2013-03-14T00:10:35.320 回答