1

我已经编写了一些 php 代码,这些代码在效率和加载速度方面可能会有所提高。我该如何改进它?请记住,我绝不擅长编码!

目前页面加载大约需要 5-10 秒。

它在数百个 wordpress 帖子中循环,将它们放在一个新的 mysql 表中并对纬度/经度进行地理编码。它还在检查帖子是否已经在数据库中。

下面是代码:

<?php
require("database.php");
// Opens a connection to a MySQL server
$con = mysql_connect("localhost", $username, $password);

if (!$con)
{
    die('Could not connect: ' . mysql_error());
}

mysql_select_db("medicom_wp", $con);

$pages = get_posts(array(
    'orderby' => 'title', 
    'post_type' => 'members',
    'numberposts' => 300,
    'post_status' => 'any'  
    ));
foreach($pages as $post) {
    setup_postdata($post);

    $company = get_field('company_name');
    $address = get_field('address');
    $city = get_field('city');
    $post_code = get_field('post_code');

    $sql = sprintf("select count('x') as cnt from markers where `name` = '%s'", mysql_real_escape_string($company));
    $row_dup = mysql_fetch_assoc(mysql_query($sql,$con));
    if ($row_dup['cnt'] == 0) {
        mysql_query("INSERT INTO markers (`name`, `address`, `lat`, `lng`, `type`) VALUES ('".$company."', '".$address.", ".$city.", ".$post_code."', '0.0', '0.0', '')");
    }
}
wp_reset_query();


define("MAPS_HOST", "maps.google.com");
define("KEY", "");

// Opens a connection to a MySQL server
$connection = mysql_connect("localhost", $username, $password);
if (!$connection) {
  die("Not connected : " . mysql_error());
}

// Set the active MySQL database
$db_selected = mysql_select_db($database, $connection);
if (!$db_selected) {
  die("Can\'t use db : " . mysql_error());
}

// Select all the rows in the markers table
$query = "SELECT * FROM markers WHERE 1";
$result = mysql_query($query);
if (!$result) {
  die("Invalid query: " . mysql_error());
}

// Initialize delay in geocode speed
$delay = 0;
$base_url = "http://" . MAPS_HOST . "/maps/geo?output=xml" . "&key=" . KEY;

// Iterate through the rows, geocoding each address
while ($row = @mysql_fetch_assoc($result)) {
  $geocode_pending = true;

  while ($geocode_pending) {
    $address = $row["address"];
    $id = $row["id"];
    $request_url = $base_url . "&q=" . urlencode($address);
    $xml = simplexml_load_file($request_url) or die("url not loading");

    $status = $xml->Response->Status->code;
    if (strcmp($status, "200") == 0) {
      // Successful geocode
      $geocode_pending = false;
      $coordinates = $xml->Response->Placemark->Point->coordinates;
      $coordinatesSplit = split(",", $coordinates);
      // Format: Longitude, Latitude, Altitude
      $lat = $coordinatesSplit[1];
      $lng = $coordinatesSplit[0];

      $query = sprintf("UPDATE markers " .
             " SET lat = '%s', lng = '%s' " .
             " WHERE id = '%s' LIMIT 1;",
             mysql_real_escape_string($lat),
             mysql_real_escape_string($lng),
             mysql_real_escape_string($id));
      $update_result = mysql_query($query);
      if (!$update_result) {
        die("Invalid query: " . mysql_error());
      }
    } else if (strcmp($status, "620") == 0) {
      // sent geocodes too fast
      $delay += 1000;
    } else {
      // failure to geocode
      $geocode_pending = false;
      echo "Address " . $address . " failed to geocoded. ";
      echo "Received status " . $status . "
\n";
    }
    usleep($delay);
  }
}
?> 
4

3 回答 3

3

您需要重组代码以使用多插入SQL 查询。这应该会大大提高性能。

而不是做这样的事情,数百次:

INSERT INTO table ( col1, col2) VALUES ( val1, val2)
INSERT INTO table ( col1, col2) VALUES ( val3, val4)
... 

你这样做,一次:

INSERT INTO table ( col1, col2) VALUES ( val1, val2), ( val3, val4)

现在,让我们将它应用到您的代码中:

$values = array();

foreach($pages as $post) {
    setup_postdata($post);

    $company = get_field('company_name');
    $address = get_field('address');
    $city = get_field('city');
    $post_code = get_field('post_code');

    $values[] = "( '$company', '$address', '$city', '$post_code', 0.0, 0.0, '')";
}

$query = 'INSERT IGNORE INTO markers (`name`, `address`, `lat`, `lng`, `type`) 
              VALUES ' . implode( ', ', $values);

现在,不要检查 SQL 行是否存在(使用该$row_dup查询),而是确保name列上有主键,然后执行INSERT IGNOREor INSERT ... ON DUPLIACATE KEY UPDATE

您可以从此SO question了解有关这些查询的更多信息。

于 2012-06-15T14:36:22.223 回答
1

许多插入语句会减慢您的速度,如果您做了很多事情,您可以将数据解析为 csv 文件,然后使用 LOAD DATA INFILE 加载,在大型数据集的情况下,性能差异可能很大,

链接

http://php.net/manual/en/function.fputcsv.php

http://dev.mysql.com/doc/refman/5.1/en/load-data.html

@nickb 有一个建议肯定会有所帮助

于 2012-06-15T14:41:14.167 回答
0

您还可以通过缓存来自您的地理编码请求的数据来加快这一速度,以限制在下一次请求时对 Google 地理编码服务的调用次数。我通常会保存请求的时间以及请求的准确性或“location_type”。然后我检查每个标记的准确性以及从上次请求开始的时间,看看我是否应该更新信息。准确性越高,请求之间的时间就越长。

https://developers.google.com/maps/documentation/geocoding/

这是基本的,但您有几个准确度选项

if($accuracy != 'ROOFTOP' || time() > ($update_time + 2592000))//check every 30 days
{
    //make a geocode request
}

ROOFTOP 的准确性与您使用 Google 的地理编码所获得的一样好。除非 Google 更改某些内容,否则无需继续更新。这就是我将其设置为 30 天的原因。

于 2012-06-15T18:45:55.337 回答