6

我有如下粗略代码(完整代码146行,其中90行是字符串解析,需要的可以添加):

ini_set('memory_limit', '7G');
$db = new PDO("mysql:host=".$dbhost.";dbname=".$dbname, $dbuser, $dbpass, array(PDO::ATTR_PERSISTENT => true));
$db->setAttribute(PDO::MYSQL_ATTR_USE_BUFFERED_QUERY, false);
$db_ub = new PDO("mysql:host=".$dbhost.";dbname=".$dbname, $dbuser, $dbpass, array(PDO::ATTR_PERSISTENT => true));
$db_ub->setAttribute(PDO::MYSQL_ATTR_USE_BUFFERED_QUERY, true);
$stmt = $db->prepare('select columns from stats where timestamp between ? and ?');
$stmt->execute(array('2020-04-25', '2020-05-25'));
while($row = $stmt->fetch(PDO::FETCH_ASSOC)) {
      echo memory_get_usage() .PHP_EOL;
      echo $row['id'] . PHP_EOL;
      $stmt2 = $db_ub->prepare('select somedata from users limit 1');
      $stmt2->execute();
      $row2 = $stmt2->fetch(PDO::FETCH_ASSOC);
      $type = !empty($row2['somedate']) ? 5 : 4;
      $result = $db_ub->prepare('insert ignore into newtable (old, type) values (?, ?)');
      $result->execute(array($row['id'], $type));
}

$stmt->execute(array('2020-04-25', '2020-05-25'));我的内存消耗期间是as .34GBps aux | grep 'php ' | awk '{$5=int(100 * $5/1024/1024)/100"GB";}{ print;}'用于监控期间的消耗selectshow full processlistSQL端来验证)。一旦脚本进入,while它就会跳转到 +5 GB。

测试setattribute

var_dump($db->setAttribute(PDO::MYSQL_ATTR_USE_BUFFERED_QUERY, false));

好像已经生效了:

bool(true)

但是当我切换缓冲或无缓冲时,行为不会改变。

$db->setAttribute(PDO::MYSQL_ATTR_USE_BUFFERED_QUERY, false)

$db->setAttribute(PDO::MYSQL_ATTR_USE_BUFFERED_QUERY, true)

使用echo $db->getAttribute(constant('PDO::MYSQL_ATTR_USE_BUFFERED_QUERY'));还会显示设置更改。

将设置移动到语句而不是https://www.php.net/manual/en/ref.pdo-mysql.php建议的连接也不起作用。

$stmt = $db->prepare('select columns from stats where timestamp between ? and ?', array(PDO::MYSQL_ATTR_USE_BUFFERED_QUERY => false));

我还尝试将缓冲区设置移动到没有影响的连接:

$db = new PDO("mysql:host=".$dbhost.";dbname=".$dbname, $dbuser, $dbpass, array(PDO::ATTR_PERSISTENT => true, PDO::MYSQL_ATTR_USE_BUFFERED_QUERY => false));

取出第二个连接似乎允许无缓冲查询按预期运行:

ini_set('memory_limit', '1G');
$db = new PDO("mysql:host=".$dbhost.";dbname=".$dbname, $dbuser, $dbpass, array(PDO::ATTR_PERSISTENT => true, PDO::MYSQL_ATTR_USE_BUFFERED_QUERY => false));
$db->setAttribute(PDO::MYSQL_ATTR_USE_BUFFERED_QUERY, false);
//$db_ub = new PDO("mysql:host=".$dbhost.";dbname=".$dbname, $dbuser, $dbpass, array(PDO::ATTR_PERSISTENT => true));
//$db_ub->setAttribute(PDO::MYSQL_ATTR_USE_BUFFERED_QUERY, true);
$stmt = $db->prepare('select columns from stats where timestamp between ? and ?');
$stmt->execute(array('2019-01-25', '2019-11-25'));
while($row = $stmt->fetch(PDO::FETCH_ASSOC)) {
      echo memory_get_usage() .PHP_EOL;
      echo $row['id'] . PHP_EOL;
      /*
     $stmt2 = $db_ub->prepare('select somedata from users limit 1');
      $stmt2->execute();
      $row2 = $stmt2->fetch(PDO::FETCH_ASSOC);
      $type = !empty($row2['somedate']) ? 5 : 4;
      $result = $db_ub->prepare('insert ignore into newtable (old, type) values (?, ?)');
      $result->execute(array($row['id'], $type));
     */
}

这种用法memory_get_usage不超过379999

如果我取消注释第二个连接并使其无缓冲,我会收到:

Cannot execute queries while other unbuffered queries are active.  Consider using PDOStatement::fetchAll().  Alternatively, if your code is only ever going to run against mysql, you may enable query buffering by setting the PDO::MYSQL_ATTR_USE_BUFFERED_QUERY attribute.

缓冲的第二个连接如最初描述的那样执行,执行时会消耗大量内存。如果ini_set('memory_limit'是高它工作,如果低它错误。使用大memory_limit不是一个可行的解决方案。

正在使用 ( Red Hat Enterprise Linux Server release 7.3 (Maipo)):

php71u-pdo.x86_64                  7.1.19-1.ius.centos7

将脚本移至较新的机器 ( Amazon Linux release 2 (Karoo)):

php73-pdo.x86_64                   7.3.17-1.el7.ius

并具有相同的行为。

4

3 回答 3

1

PDO::ATTR_PERSISTENT值不是布尔值。它标识正在使用的连接,对多个连接使用唯一值。就我而言:

$db = new PDO("mysql:host=".$dbhost.";dbname=".$dbname, $dbuser, $dbpass, array(PDO::ATTR_PERSISTENT => 'unbuff', PDO::MYSQL_ATTR_USE_BUFFERED_QUERY => false));
$db_ub = new PDO("mysql:host=".$dbhost.";dbname=".$dbname, $dbuser, $dbpass, array(PDO::ATTR_PERSISTENT => 'buff', PDO::MYSQL_ATTR_USE_BUFFERED_QUERY => true));
于 2020-06-01T15:46:23.480 回答
0

难道你不能通过简单地运行一个查询来摆脱大部分代码:

 INSERT IGNORE INTO newtable
     SELECT  ...,
             IF(..., 5, 4)
         FROM oldtable WHERE ...;

这样,您就可以摆脱 7G 内存问题。

如果结果证明一次做太多事情,那就把它分成几块。请参阅此处的讨论:http: //mysql.rjweb.org/doc.php/deletebig#deleting_in_chunks (谈论DELETEs,但它可以适应其他事物,例如您的SELECT。)

关于另一个话题:为什么select somedata from users limit 1在循环内执行?似乎每次都得到相同的数据。此外,如果没有ORDER BY,您将无法预测limit 1您将获得哪一行。

于 2020-06-01T19:31:01.293 回答
-2

您实际上是在进行 135000000 个查询,而不是迭代 135000000 个对象。

将代码更改为仅执行一个查询,但对元素进行排序,就好像它们在您的 for 循环中一样。

$db = new PDO("mysql:host=".$dbhost.";dbname=".$dbname, $dbuser, $dbpass, array(PDO::ATTR_PERSISTENT => true));
$stmt = $db->prepare('SELECT * FROM stats ORDER BY id ASC');
$stmt->execute();
while ($row = $stmt->fetch(PDO::FETCH_ASSOC)) {
    // ...
}

你甚至不需要这个if,数据库本身可以更快地使用它的逻辑:

if(!empty($row['id'])) {

反而:

SELECT * FROM stats WHERE id IS NOT NULL ORDER BY id ASC

我有一段时间没有研究 PDO/MySQL,但我假设 unbuffered 允许您使用游标:

$pdo->setAttribute(PDO::MYSQL_ATTR_USE_BUFFERED_QUERY, false);

考虑到每个连接只能有一个查询活动。您基本上是在使用连接的缓冲区。

更好的选择是以 map reduce 的方式只加载小块。

SELECT * FROM stats LIMIT 100, 0

使用结果,然后

SELECT * FROM stats LIMIT 100, 100

等等。

于 2020-05-30T01:55:22.127 回答