6

我为图形文件格式编写了一个简单的阅读器和解析器。问题是它非常慢。以下是相关方法:

Graph METISGraphReader::read(std::string path) {
    METISParser parser(path);
    std::pair<int64_t, int64_t> header = parser.getHeader();
    int64_t n = header.first;
    int64_t m = header.second;

    Graph G(n);

    node u = 0;
    while (parser.hasNext()) {
        u += 1;
        std::vector<node> adjacencies = parser.getNext();
        for (node v : adjacencies) {
            if (! G.hasEdge(u, v)) { 
                G.insertEdge(u, v);
            }
        }
    }
    return G;
}

std::vector<node> METISParser::getNext() {
    std::string line;
    bool comment = false;
    do {
        comment = false;
        std::getline(this->graphFile, line);
        // check for comment line starting with '%'
        if (line[0] == '%') {
            comment = true;
            TRACE("comment line found");
        } else {
            return parseLine(line);
        }

    } while (comment);
}

static std::vector<node> parseLine(std::string line) {
    std::stringstream stream(line);
    std::string token;
    char delim = ' ';
    std::vector<node> adjacencies;

    // split string and push adjacent nodes
    while (std::getline(stream, token, delim)) {
        node v = atoi(token.c_str());
        adjacencies.push_back(v);
    }
    return adjacencies;
}

为了诊断它为什么这么慢,我在分析器(Apple Instruments)中运行它。结果令人惊讶:由于锁定开销,它很慢。该程序将超过 90% 的时间花在pthread_mutex_lock_pthread_cond_wait.

仪器

我不知道锁定开销来自哪里,但我需要摆脱它。你能建议接下来的步骤吗?

编辑:查看为_pthread_con_wait. 通过查看以下内容,我无法找出锁定开销的来源:

在此处输入图像描述

4

2 回答 2

2

展开 _pthread_cond_wait 和 pthread_mutex_lock 调用上的调用堆栈以找出调用锁定调用的位置。

作为一种猜测,我会说它存在于你正在做的所有不必要的堆分配中。堆是线程安全的资源,在这个平台上,线程安全可以通过互斥体提供。

于 2013-01-23T15:55:00.467 回答
1

所有从 a 读取数据的函数istream都会锁定mutex,从 a 读取的数据streambuf并解锁mutex. streambuf为了消除这种开销,请直接从而不是从读取文件,istream并且不要使用它stringstream来解析数据。

这是一个版本,getline它使用streambuf而不是istream

bool fastGetline(streambuf* sb, std::string& t)
{
    t.clear();
    for(;;) {
        int c = sb->sbumpc();
        switch (c) {
        case '\n':
            return true;
        case '\r':
            if(sb->sgetc() == '\n')
                sb->sbumpc();
            return true;
        case EOF:
            return !t.empty();
        default:
            t += (char)c;
    }
}
于 2013-01-23T17:54:14.063 回答