1

我正在屏幕上抓取一个页面,其中包含我想在 mysql 数据库中写入的数据。

$url = "http://example.com/index.jsp";

$raw = file_get_contents($url);

$newlines = array("\t","\n","\r","\x20\x20","\0","\x0B");

$content = str_replace($newlines, "", $raw);

$start = strpos($content,'<table border="0" cellspacing="0" cellpadding="0" width="100%">"');

$end = strpos($content,'</table>',$start) + 8;

$table = substr($content,$start,$end-$start);

数据处理效果很好,所有的 html 标签、空格和 html 特殊字符等都已从数据中删除。在处理页面中回显时,这些值看起来很好。

function cleanSiteVal($siteval){
    $repl = array('value=', '"');
    $siteval = strip_tags($siteval);
    $siteval = str_replace($repl, '', $siteval);
    $siteval = html_entity_decode($siteval);

    return $siteval;
}

foreach ($rows[0] as $row){

    if ((strpos($row,'<td align')==true)){
                //echo $row;
                preg_match_all( '@value="([^"]*)"@', $row, $cells ) ;             
        $fln = cleanSiteVal($cells[0][0]);
        $flf = cleanSiteVal($cells[0][1]);
        $sch = cleanSiteVal($cells[0][2]);
        $est = cleanSiteVal($cells[0][3]);
        $trm = cleanSiteVal($cells[0][4]);
        $sts = cleanSiteVal($cells[0][5]);
        echo 'flnr: '.$fln.', from: '.$flf.', scheduled: '.$sch.', estimated: '.$est.', terminal: '.$trm.', status: '.$sts.'<br />';


        $fliarr[] = array(
                    0 => $fln,
                    1 => $flf,
                    2 => $sch,
                    3 => $est,
                    4 => $trm,
                    5 => $sts 
                    );
    }
}

我“回显”了我从这个处理过的数据中构建的查询,并且在 phpmyadmin 中执行的这个查询工作正常,尽管我在我的 for 循环中执行的查询不是。

for ($i = 0; $i < count($fliarr); $i++) {

    $nrfli = $fliarr[$i][0];

    $stat = $fliarr[$i][5];
    $term = $fliarr[$i][4];
    if ($fliarr[$i][3]!='' || !empty($fliarr[$i][3])) { $abr = $today.' '.$fliarr[$i][3].':00'; } else { $abr = $today.' '.$fliarr[$i][2].':00'; }

    //echo 'estimated/sched. time: '.$abr.', flugnr: '.$fliarr[$i][0].', status: '.$stat.'<br />';

    $sql = "UPDATE `some_table` SET `val1`='$stat', `val2`='$term', `val3`='$abr' WHERE (`datetime_field` BETWEEN '$sfrom' AND '$till') AND `val4`='$nrfli'";
    echo $sql.'<br />';
    $res = mysql_query($sql);

    if(!$res) {
        echo mysql_error().' Fehler bei der Update Abfrage';
    } else {
        //echo 'Ok, Update Buchungen'.$nrfli.'<br />';
    }
}

如何管理此查询以在我的 for 循环中工作?我知道,这是不好的做法,我也尝试使用 PDO 层并准备我的查询,但这也不起作用。

同样,从 for 循环中的 echo 复制的查询在 phpmyadmin 中工作。为什么不在我的 for 循环中?

4

2 回答 2

2

原来是 的问题 空白。html_entity_decode 并没有因为这个解释而摆脱它:

你可能想知道为什么 trim(html_entity_decode(' ')); 不会将字符串缩减为空字符串,这是因为 '& nbsp;' entity 不是 ASCII 码 32(由 trim() 去除),而是默认 ISO 8859-1 编码中的 ASCII 码 160 (0xa0)。

来源:php docs htmlentitydecode

这是我为找出答案所做的:

  1. 我制作了一个带有 doctype 声明和 charset 元标记的完整 html 页面。
  2. 我选择 mysql_encoding 为 utf-8
  3. 我在有效的 html 段落中回显了查询 这表明它们是查询值空格内的奇数字符
  4. return utf8_encode($siteval);在 cleanSiteVal 函数中添加了
  5. 我添加了$siteval = str_replace('&nbsp;', ' ', $siteval);

所有这些步骤最终清理了来自抓取站点的值,并触发了我的循环中的查询。欢呼!!!!这对我来说是一个很大的教训。我将始终为我的连接设置 mysql_encoding,这样可以在动态生成的 html 代码中围绕回显值节省大量 utf8_encode。它显示了 html & nbsp ; 数据中留下的空白。

所以最后这里是完整的 cleanSiteVal() 函数:

   function cleanSiteVal($siteval){
    $repl = array('value=', '"', '&nbsp;');
    $siteval = strip_tags($siteval);
    $siteval = str_replace($repl, '', $siteval);
    $siteval = html_entity_decode($siteval);
    $siteval = str_replace('&auml;', 'ä', $siteval);
    $siteval = mysql_real_escape_string($siteval);
    return utf8_encode($siteval);
}
于 2012-10-27T12:07:04.137 回答
0

你的 sql 中的变量在引号之间,试试这个

   $sql = "UPDATE some_table SET val1='".$stat."', val2='".$term."', val3='".$abr."' WHERE (`datetime_field` BETWEEN '".$sfrom."' AND '".$till."') AND val4='".$nrfli."'";
于 2012-10-26T21:39:37.447 回答