我编写了四个不同的程序来计算两个文件中的总字数。这四个版本看起来基本相同。前三个版本使用两个线程进行计数,只是三个语句的顺序不同。最后一个版本使用一个线程来计数。我将首先列出每个版本的不同部分和共同部分,然后是每个版本的输出和我的问题。
不同的部分:
// version 1
count_words(&file1);
pthread_create(&new_thread, NULL, count_words, &file2);
pthread_join(new_thread, NULL);
// version 2
pthread_create(&new_thread, NULL, count_words, &file2);
count_words(&file1);
pthread_join(new_thread, NULL);
// version 3
pthread_create(&new_thread, NULL, count_words, &file2);
pthread_join(new_thread, NULL);
count_words(&file1);
// version 4
count_words(&file1);
count_words(&file2);
公共部分:(将不同的部分插入到这个公共部分中,形成一个完整的版本)
#include <stdio.h>
#include <pthread.h>
#include <ctype.h>
#include <stdlib.h>
#include <time.h>
#define N 2000
typedef struct file_t {
char *name;
int words;
} file_t;
double time_diff(struct timespec *, struct timespec *);
void *count_words(void *);
// Usage: progname file1 file2
int main(int argc, char *argv[]) {
pthread_t new_thread;
file_t file1, file2;
file1.name = argv[1];
file1.words = 0;
file2.name= argv[2];
file2.words = 0;
// Insert different part here
printf("Total words: %d\n", file1.words+file2.words);
return 0;
}
void *count_words(void *arg) {
FILE *fp;
file_t *file = (file_t *)arg;
int i, c, prevc = '\0';
struct timespec process_beg, process_end;
struct timespec thread_beg, thread_end;
double process_diff, thread_diff;
clock_gettime(CLOCK_PROCESS_CPUTIME_ID, &process_beg);
clock_gettime(CLOCK_THREAD_CPUTIME_ID, &thread_beg);
fp = fopen(file->name, "r");
for (i = 0; i < N; i++) {
while ((c = getc(fp)) != EOF) {
if (!isalnum(c) && isalnum(prevc))
file->words++;
prevc = c;
}
fseek(fp, 0, SEEK_SET);
}
fclose(fp);
clock_gettime(CLOCK_PROCESS_CPUTIME_ID, &process_end);
clock_gettime(CLOCK_THREAD_CPUTIME_ID, &thread_end);
process_diff = time_diff(&process_beg, &process_end);
thread_diff = time_diff(&thread_beg, &thread_end);
printf("count_words() in %s takes %.3fs process time and"
"%.3fs thread time\n", file->name, process_diff, thread_diff);
return NULL;
}
double time_diff(struct timespec *beg, struct timespec *end) {
return ((double)end->tv_sec + (double)end->tv_nsec*1.0e-9)
- ((double)beg->tv_sec + (double)beg->tv_nsec*1.0e-9);
}
笔记
- file1 是一个包含 10000 个单词的“word”文件。file2 是 file1 的副本,由 cp 命令创建。
- 为了使执行时间足够长,程序会重复计算单词。N 是循环数。所以结果不是总单词的准确数量,而是乘以 N。
- 请不要过分强调计数算法。我只关心这个例子中的执行时间。
- 重要信息:该机器是 Intel® Celeron(R) CPU 420 @ 1.60GHz。一个核心。操作系统是 Linux 3.2.0。正如其他人所说,也许一个核心是导致这种奇怪现象的原因。但我还是想弄清楚。
程序统计字数,使用clock_gettime()计算例程count_words()的进程cpu时间和线程cpu时间,然后输出次数和字数。以下是输出和我对问题的评论。如果有人能解释花费额外时间的原因,我将不胜感激。
// version 1
count_words() in file1 takes 2.563s process time and 2.563s thread time
count_words() in file2 takes 8.374s process time and 8.374s thread time
Total words: 40000000
注释:原线程完成 count_words() 并等待新线程死亡。当 count_words() 在新线程中运行时,不会发生上下文切换(因为进程时间 == 线程时间)。为什么需要这么多时间?新线程中的 count_words() 会发生什么?
// version 2
count_words() in file1 takes 16.755s process time and 8.377s thread time
count_words() in file2 takes 16.753s process time and 8.380s thread time
Total words: 40000000
评论:这里有两个线程并行运行。发生上下文切换,因此进程时间>线程时间。
// version 3
count_words() in file2 takes 8.374s process time and 8.374s thread time
count_words() in file1 takes 8.365s process time and 8.365s thread time
Total words: 40000000
注释:新线程首先计数,原始线程等待它。新线程加入后,原线程开始计数。他们都没有上下文切换,为什么要花这么多时间,尤其是新线程加入后的计数?
// version 4
count_words() in file1 takes 2.555s process time and 2.555s thread time
count_words() in file2 takes 2.556s process time and 2.556s thread time
Total words: 40000000
评论:最快的版本。没有创建新线程。两个 count_words() 都在一个线程中运行。