12

所以我已经阅读了计算图表趋势线的两个相关问题,但我仍然迷路了。

我有一个 xy 坐标数组,我想提出另一个 xy 坐标数组(可以是更少的坐标),它表示使用 PHP 的对数趋势线。

我将这些数组传递给 javascript 以在客户端绘制图形。

4

3 回答 3

29

对数最小二乘

log由于我们可以通过取值将对数函数转换为直线x,因此我们可以执行线性最小二乘曲线拟合。事实上,这项工作已经为我们完成,并且在Math World上提供了一个解决方案。

简而言之,我们得到了来自分布的值,$X例如. 最小二乘法将给出一些值,并最小化从参数曲线到给定数据点的距离。$Yy = a + b * log(x)aFitbFit

这是 PHP 中的示例实现:

首先,我将生成一些具有已知基础分布的随机数据,由$a$b

  // True parameter valaues
  $a = 10;
  $b = 5;

  // Range of x values to generate
  $x_min = 1;
  $x_max = 10;
  $nPoints = 50;

  // Generate some random points on y = a * log(x) + b
  $X = array();
  $Y = array();
  for($p = 0; $p < $nPoints; $p++){
    $x = $p / $nPoints * ($x_max - $x_min) + $x_min;
    $y = $a + $b * log($x);

    $X[] = $x + rand(0, 200) / ($nPoints * $x_max);
    $Y[] = $y + rand(0, 200) / ($nPoints * $x_max);

  }

现在,这里是如何使用给出的方程来估计$a$b

  // Now convert to log-scale for X
  $logX = array_map('log', $X);

  // Now estimate $a and $b using equations from Math World
  $n = count($X);
  $square = create_function('$x', 'return pow($x,2);');
  $x_squared = array_sum(array_map($square, $logX));
  $xy = array_sum(array_map(create_function('$x,$y', 'return $x*$y;'), $logX, $Y));

  $bFit = ($n * $xy - array_sum($Y) * array_sum($logX)) /
          ($n * $x_squared - pow(array_sum($logX), 2));

  $aFit = (array_sum($Y) - $bFit * array_sum($logX)) / $n;

然后,您可以根据需要为您的 Javascript 生成点数:

  $Yfit = array();
  foreach($X as $x) {
    $Yfit[] = $aFit + $bFit * log($x);
  }

在这种情况下,代码估计bFit = 5.17aFit = 9.7,这仅对50数据点非常接近。

替代文字

对于下面评论中给出的示例数据,对数函数不太适合。

替代文字

最小二乘解 y = -514.734835478 + 2180.51562281 * log(x)本质上是该域中的一条线。

于 2010-05-04T21:25:38.687 回答
4

我建议使用库:http ://www.drque.net/Projects/PolynomialRegression/

Composer 提供:https ://packagist.org/packages/dr-que/polynomial-regression 。

于 2015-10-03T18:40:48.293 回答
1

万一有人对 create_function 有问题,这就是我编辑它的方法。(虽然我没有使用日志,所以我确实把它们拿出来了。)

我还减少了计算次数并添加了 R2。到目前为止它似乎有效。

function lsq(){
    $X = array(1,2,3,4,5);
    $Y = array(.3,.2,.7,.9,.8);

    // Now estimate $a and $b using equations from Math World
    $n = count($X);

    $mult_elem = function($x,$y){   //anon function mult array elements 
        $output=$x*$y;              //will be called on each element
        return $output;
    };

    $sumX2 = array_sum(array_map($mult_elem, $X, $X));

    $sumXY = array_sum(array_map($mult_elem, $X, $Y));
    $sumY = array_sum($Y);
    $sumX = array_sum($X);

    $bFit = ($n * $sumXY - $sumY * $sumX) /
    ($n * $sumX2 - pow($sumX, 2));
    $aFit = ($sumY - $bFit * $sumX) / $n;
    echo ' intercept ',$aFit,'    ';
    echo ' slope ',$bFit,'   ' ;    

    //r2
    $sumY2 = array_sum(array_map($mult_elem, $Y, $Y));
    $top=($n*$sumXY-$sumY*$sumX);
    $bottom=($n*$sumX2-$sumX*$sumX)*($n*$sumY2-$sumY*$sumY);
    $r2=pow($top/sqrt($bottom),2);
    echo '  r2  ',$r2;
}
于 2020-01-12T03:40:58.357 回答