6

我目前正在使用条件变量来同步两个线程(pthreads),并且遇到了意外的行为,即使我已经验证了一个线程已经在等待某个条件,但当另一个线程发出该条件的信号时它不会唤醒。

值得注意的是,我已经在桌面环境中运行了它,并且它按预期运行,但是当我使用 uclibc 在嵌入式环境中运行程序时会出现这个问题。

为了进行故障排除,我将我的代码剥离为仅执行锁定/解锁/信号的两个线程,如下所示:

#include <stdio.h>
#include <pthread.h>
#include <stdbool.h>

pthread_mutex_t mutex1 = PTHREAD_MUTEX_INITIALIZER;
pthread_mutex_t mutex2 = PTHREAD_MUTEX_INITIALIZER;
pthread_cond_t condition1 = PTHREAD_COND_INITIALIZER;
pthread_cond_t condition2 = PTHREAD_COND_INITIALIZER;
bool predicate1 = false;
bool predicate2 = false;

static void * ThreadFunc2(void * arg) {
    sleep(1);    // For testing purposes, ensures this thread is run after Thread1

    pthread_mutex_lock(&mutex2);
    while(1) {
        pthread_mutex_lock(&mutex1);
        // Do some work - Eg receive some data from a socket
        predicate1 = false;
        pthread_cond_signal(&condition1);
        pthread_mutex_unlock(&mutex1);

        predicate2 = true;
        while(predicate2 == true)
            pthread_cond_wait(&condition2, &mutex2);

        // Do some more work - Eg send response data to socket
    }
}

static void * ThreadFunc1(void * arg) {
    int result;

    pthread_mutex_lock(&mutex1); 
    while(1) {
        predicate1 = true;
        while(predicate1 == true)
            pthread_cond_wait(&condition1, &mutex1);

        // Do some work - Eg process data on the socket and prepare response data to be sent
        pthread_mutex_lock(&mutex2);
        predicate2 = false;
        pthread_cond_signal(&condition2);
        pthread_mutex_unlock(&mutex2);
    }
}

int main(int argc, char * argv[]) {
    pthread_t thread1Id, thread2Id;

    pthread_create(&thread1Id, NULL, ThreadFunc1, NULL);
    pthread_create(&thread2Id, NULL, ThreadFunc2, NULL);

    while(1) {
        sleep(1);
    }

    return 0;
}

如果我排除与 mutex2/condition2/predicate2 相关的所有语句,这两个线程将按预期一起工作。

使用上面列出的代码,在很短的时间后(因为所有工作都已被剥离,每个循环都运行得非常快)ThreadFunc1 中的 condition1 等待不会唤醒,即使它由 Threadfunc2 发出信号导致应用程序暂停。

另外为了帮助我调试,我重新定义了 pthread_* 函数以在调用实际 pthread_* 函数之前使用匹配的行号将消息打印到标准输出。这使我能够跟踪每个 pthread 操作的流程,并验证信号是否正在发送到已经等待的状态。

任何人都可以帮助我阐明我在上面的实施中可能存在的任何潜在问题吗?

在此先感谢您的任何建议。

4

3 回答 3

2

您的错误是在调用 pthread_cond_wait() 之后没有解锁条件变量使用的互斥锁。

例如 pthread_cond_wait() 在线程被阻塞时在内部解锁互斥锁,但它在唤醒时重新获取锁,您需要显式释放它。

有关 cond 的更多详细信息,请参阅本教程。变量:https ://computing.llnl.gov/tutorials/pthreads/#ConditionVariables

于 2013-05-27T05:55:21.773 回答
1

我遇到了类似的问题。就我而言,有时信号是在阻塞线程等待之前发送的。这种情况下的行为是两个线程都“卡住”了。我们通过添加一个通知信号已发送的标志来解决它。

于 2013-05-27T05:13:59.253 回答
1

解决方案-请参阅下面的说明
将 pthread_mutex_unlock() 放在信号调用 pthread_cond_signal() 之前而不是之后应该可以解决问题

...
pthread_mutex_lock(&mutex1);
predicate1 = false;
pthread_mutex_unlock(&mutex1);
pthread_cond_signal(&condition1);
...

在函数 ThreadFunc2 和线程 1 中类似

...
pthread_mutex_lock(&mutex2);
predicate2 = true;
pthread_mutex_unlock(&mutex2);
pthread_cond_signal(&condition2);
...

在函数 ThreadFunc1 中。

说明在您的程序中,线程 2 进入信号调用

pthread_cond_signal(&condition1); //  thread 2 with mutex1 locked

与 mutex1 锁定。线程1只能离开阻塞

pthread_cond_wait(&mutex1);       //  thread 1 leaves only after mutex1 unlocked

调用自身锁定 mutex1,这是此函数调用的保证行为 - 这意味着它应该被所有其他线程解锁才能继续。如果您有一个 pthread_cond_signal() 的实现,该实现会阻塞直到接收信号的线程继续执行,那么当它进入调用并锁定相应的互斥锁时会导致死锁。这也可以解释为什么一个环境可以简单地工作而另一个不能正常工作:例如,当您的桌面环境没有对 pthread_cond_signal() 的阻塞调用而您的嵌入式环境有时。

于 2016-12-25T23:57:53.827 回答