6

我有 100 000+ 行的表,我想在学说中选择所有这些,并对每一行做一些操作,在 symfony2 中我尝试使用这个查询:

    $query = $this->getDefaultEntityManager()
        ->getRepository('AppBundle:Contractor')
        ->createQueryBuilder('c')
        ->getQuery()->iterate();

    foreach ($query as $contractor) {
        // doing something
    }

但后来我得到了内存泄漏,因为我认为它把所有数据都写在了内存中。

当我这样做时,我在那个库中拥有更多的 ADOdb 经验:

$result = $ADOdbObject->Execute('SELECT * FROM contractors');
   while ($arrRow = $result->fetchRow()) {
        // do some action
   }

我没有任何内存泄漏。

那么如何从表中选择所有数据并且不会在 symfony2 中出现内存泄漏?

问题编辑

当我尝试删除 foreach 并进行迭代时,我也会遇到内存泄漏:

$query = $this->getDefaultEntityManager()
            ->getRepository('AppBundle:Contractor')
            ->createQueryBuilder('c')
            ->getQuery()->iterate();
4

3 回答 3

6

正常的方法是使用iterate()

$q = $this->getDefaultEntityManager()->createQuery('select u from AppBundle:Contractor c');
$iterableResult = $q->iterate();
foreach ($iterableResult as $row) {
    // do something
}

然而,正如教义文档所说,这仍然会导致错误。

结果可能被数据库客户端/连接分配的额外内存完全缓冲,PHP 进程不可见。对于大型集,这可能很容易无缘无故地终止该过程。

最简单的方法是简单地创建带有偏移量和限制的较小查询。

//get the count of the whole query first
$qb = $this->getDefaultEntityManager();
$qb->select('COUNT(u)')->from('AppBundle:Contractor', 'c');
$count = $qb->getQuery()->getSingleScalarResult();

//lets say we go in steps of 1000 to have no memory leak
$limit = 1000;
$offset = 0;

//loop every 1000 > create a query > loop the result > repeat
while ($offset < $count){
    $qb->select('u')
        ->from('AppBundle:Contractor', 'c')
        ->setMaxResults($limit)
        ->setFirstResult($offset);
    $result = $qb->getQuery()->getResult();
    foreach ($result as $contractor) {
        // do something
    }
    $offset += $limit;
}

对于如此庞大的数据集,这很可能会超过最大执行时间,默认情况下为30 秒。因此,请确保手动更改php.ini 中的set_time_limit。如果您只想使用已知模式更新所有数据集,您应该考虑编写一个大型更新查询,而不是在 PHP 中循环和编辑结果。

于 2015-10-21T08:37:19.100 回答
0

尝试使用这种方法:

foreach ($query as $contractor) {
    // doing something

    $this->getDefaultEntityManager()->detach($contractor);
    $this->getDefaultEntityManager()->clear($contractor);
    unset($contractor); // tell to the gc the object is not in use anymore

}

希望这有帮助

于 2015-10-21T07:24:45.610 回答
0

如果您确实需要获取所有记录,我建议您直接使用 database_connection。查看它的界面并选择不会将所有数据加载到内存中的方法(并且不会将记录映射到您的实体)。

你可以使用这样的东西(假设这段代码在控制器中):

$db = $this->get('database_connection');
$query = 'select * from <your_table>';
$sth = $db->prepare($query);
$sth->execute();
while($row = $sth->fetch()) {
    // some stuff
}

可能这不是您所需要的,因为您可能希望在处理完所有集合后拥有对象。但也许你不需要这些对象。无论如何想想这个。

于 2015-10-21T08:11:30.737 回答