4

我有一个这样的循环:

<?php
ini_set('memory_limit', '16024M');
ini_set('set_time_limit', 9999);
ini_set('max_execution_time', 9999);
ini_set('display_errors',  TRUE);
ini_set('error_reporting',  E_ALL);

for ($k = 1; $k <= 50; $k++) {

    $haystack = array();

    for ($i = 1; $i <= 100; $i++) {

        $randomChar = substr(md5(microtime()),rand(0,26), 1);

        $haystack[] = $randomChar;

    }

    $haystack[] = 'X';

    $startTime = microtime(true);

    // sleep(0);

    $result = in_array('X', $haystack);

    $endTime = microtime(true);

    echo number_format(1000000 * ($endTime - $startTime), 20, ",", " ") . ' ';

 }

这些是输出的前几行:

1,90734863281250000000 0,95367431640625000000 1,19209289550781250000 1,90734863281250000000 1,19209289550781250000 0,95367431640625000000 0,95367431640625000000 1,90734863281250000000 0,95367431640625000000 20,02716064453125000000 0,95367431640625000000 1,19209289550781250000 0,95367431640625000000 0,95367431640625000000 0,00000000000000000000 0,95367431640625000000 0, 95367431640625000000 0,95367431640625000000 0,00000000000000000000 0,95367431640625000000 0,00000000000000000000

如您所见,有几行说明持续时间为“0”——这实际上是不可能的。如果我取消注释包含sleep(0)命令的行,则没有零持续时间。

系统设置

  • PHP 7.0 与 FPM
  • nginx 1.10.3
  • Ubuntu 16.04

我在 CLI 上运行循环并通过浏览器调用它。

4

2 回答 2

3

数组中的 101 个项目对于智能 php 来说足够小了,它具有静态优化技巧和强大的 cpu。

如果您想看到 0-s 消失了,那么生成 1000 个项目:

for ($i = 1; $i <= 1000; $i++) {
    $haystack[] = substr(md5(microtime()),rand(0,26), 1);
}

PS 我已经使用 7.1 和 5.6 检查了您的代码,因此存在很大差异:

php7.1 与 php5.6

于 2018-12-03T22:26:37.060 回答
0

只是除了@num8er 答案,这似乎是答案,我试图找出更多,因为这真的让我有些不眠之夜。我稍微改进了上面的脚本并运行了一些额外的测量:

  ini_set('memory_limit', '16024M');
  ini_set('set_time_limit', 9999);
  ini_set('set_time_limit', -1);
  ini_set('max_execution_time', 9999);
  ini_set('max_execution_time', -1);
  ini_set('display_errors',  TRUE);
  ini_set('error_reporting', E_ALL);

echo "<table>";
echo "<tr>";
    echo "<th>duration</th>";
    echo "<th>position</th>";
    echo "<th>fake</th>";
    echo "<th>found</th>";
    echo "<th>optimized</th>";
echo "</tr>";

$endPosition = TRUE;

$fake = false;

for ($k = 1; $k <= 10000; $k++) {

    $haystack = array();

    for ($i = 1; $i <= 50000; $i++) {

        $randomChar = substr(md5(microtime()),rand(0,26), 1);

        $haystack[] = $randomChar;

    }

    if ($fake) {

        $needle = NULL;


    } else {

        if ($endPosition) {

            $needle = $haystack[sizeof($haystack) - 1];

        } else {

            $needle = $haystack[floor(sizeof($haystack)/ 2)];

        }

    }

    $startTime = microtime(true);

    //sleep(0);

    $result = in_array($needle, $haystack);

    $endTime = microtime(true);

    $duration = ($endTime - $startTime);

    echo "<tr>";
        echo "<td>";
        echo number_format($duration, 30, ",", " ");
        echo "</td>";
        echo "<td>";
        echo ($endPosition) ? "end": "middle";
        echo "</td>";
        echo "<td>";
        echo ($fake) ? "fake": "no fake";
        echo "</td>";
        echo "<td>";
        echo ($result) ? "found": "not found";
        echo "</td>";
        echo "<td>";
        echo ($duration == 0) ? "optimized": "---";
        echo "</td>";
    echo "</tr>";

    $endPosition = (rand(0,100) < 50) ? TRUE : FALSE;
    $fake = (rand(0,100) < 25) ? TRUE : FALSE;

}

echo "</table>";

我添加了一个随机的“假功能”。随机 25% 的迭代不应返回正搜索结果。在随机 50% 的迭代中,针将被放置在干草堆的中间,而不是在最后。我针对不同的设置(迭代次数数组长度)运行了这个脚本几次,最后我得到了大约 225.000 个结果行。快速添加一个小数据透视表显示,其中 PHP(7.0.32 fpm 和 CPU(Intel(R) Xeon(R) CPU E5-2680 v3 @ 2.50GHz)达到了极限:

搜索数组、长度与迭代时的最短持续时间

数字是毫秒/1000,所以即使是最难的(比如 500.000 个键,1.000 次迭代)也需要 0,000000953674 微秒 - 这要归功于优化。这很让人佩服。

同样有趣的是:即使对于不同的迭代,最小持续时间(如果不是“0”)相同(0,000953674)或加倍0,000001907349)!所以,我的假设是,但这是非常幼稚的想法,如果我用更大的数组或更多的迭代运行测试,下一个即将到来的最小值将是0.00000381469 microseonds

正如您还可以看到的,正如 num8er 已经指出的那样,优化的潜力越大,工作就越难。

50.000 键阵列的最快持续时间前 10 名

对长度为 50.000 个键的数组进行 10 次爬行甚至比 100 或 1.000 次迭代还要慢。在 1.000 次迭代中,超过 10% 的结果是在“优化”时间内交付的。

最后,我想指出,如果针在干草堆的中间,或者在最后,似乎没有区别。下图显示了搜索 500.000 键数组时 10、100 和 1.000 次迭代的最短持续时间。如您所见,最小值始终是“神奇”的 0,000000953674:

具有不同针位置的 500.000 键阵列的最短持续时间

不用说,每次迭代都会返回正确的结果。因此,当in_array()爬取不包含针头的 haystack-array 时,它从未返回过肯定的结果。

这可能不会为 PHP 优化特性添加更深层次的技术细节,但我想看看这个特性的影响会很有趣。

于 2018-12-05T10:45:24.267 回答