4

因此,当我准备迁移到不支持此功能的 Cassandra,而是支持许多选择语句时,我正在从查询中删除联接。我对我的 mysql 表(我目前正在使用的)中的 50 行数据进行了基准测试,结果产生了 101 个查询(全部选择),完成所有这些查询大约需要 0.035 秒。然后我将其更改为一些数组操作(目前在 PHP 中),并将其减少到 3 个查询,其中包含一堆 O(n) for 循环。

我假设我的系统是在 PHP、Python、MySQL 还是 Cassandra (NoSQL) 上使用几个 O(n) for 循环而不是更多查询来处理数据要快得多,我已经减少了从0.035s 到 0.004s 使用这种新方法,如下所示。

有什么替代方法可以缩短这个时间吗?还是我走在正确的轨道上?在任何情况下运行所有​​查询都更快(除了当它变成 O(n^2) 时)?谢谢:

// Now go through and get all of the user information (This is slower in mysql, but maybe faster in cassandra)
        /*foreach ($results as $key => $row)
        {
            // Create query
            $query = DB::select('id', 'username', 'profile_picture')->from('users')->where('id', '=', $row['uid']);

            // Execute it
            $results2 = $query->execute(null, false);

            // Join it
            $data[$key] = array_merge($row, $results2[0]);
        }*/

        // Get all the user information (faster in mysql since less queries)
        $uids = array();
        $ids = array();
        foreach ($results as $key => $row)
        {
            if (!in_array($row['uid'], $uids))
                $uids[] = $row['uid'];
            if (!in_array($type, array('userProfile')))
                $ids[] = $row['comment_id'];
        }

        // Create query
        $query = DB::select('id', 'username', 'profile_picture')->from('users')->where('id', '=', $uids);

        // Execute it
        $results2 = $query->execute(null, false);

        $user_data = array();

        foreach ($results2 as $key => $row)
        {
            $user_data[$row['id']] = array('uid' => $row['id'], 'username' => $row['username'], 'profile_picture' => $row['profile_picture']);
        }

        foreach ($results as $key => $row)
        {
            $data[$key] = array_merge($row, $user_data[$row['uid']]);
        }
        // End faster user info section
4

2 回答 2

3

使用 Cassandra,您可以使用 multi get 在一个查询中请求所有键,这比一堆单个查询要快得多。我有时会在查询中要求数千个键,而响应时间实际上是即时的。

于 2012-08-16T13:16:08.873 回答
0

有越来越多的工具,如 playOrm(也有一个原始的临时工具即将推出)支持连接,但仅支持表的分区(不是整个表),并在幕后使用 nosql 模式进行索引。查看宽行模式,看看它是否对您有用。IT 有时可以帮助加快速度。

于 2012-08-21T14:38:37.847 回答