0

我正在从网站获取数据,当我解析“数学、化学、科学”等单个单词时,下面提到的脚本可以正常工作。但是,如果我尝试解析包含中间空格的关键字,例如“商业数学”等等浏览器只是永远加载它似乎不起作用。请指导我..

<?php
include("simple_html_dom.php");

$keywords = "business math,chemistry,science";
$keywords = explode(',', $keywords);

foreach($keywords as $keyword) {
    echo '<br><b><font color="red">Keyword: </font><font color="blue">'.$keyword.'</font></b><br>';

    $html = file_get_html('http://www.tutorvista.com/search/'.$keyword);

    $i = 1;
    foreach($html->find('div[style=padding:20px; border-top:thin solid #DDDDDD; border-bottom:none;]') as $element) {
        foreach($element->find('div[class=entry-abstract]') as $div) {
            $title[$i] = $div->plaintext.'<br><br>';
        }
        $i++;
    }
    print_r($title);
}
?>
4

1 回答 1

0

问题在于:

$html = file_get_html('http://www.tutorvista.com/search/'.$keyword);

该函数在内部使用 file_get_contents(),它不接受空格并且需要使用 urlencode() 对 URI 进行编码。

试试这个:

$html = file_get_html( urlencode('http://www.tutorvista.com/search/'.$keyword) );

参考:

http://sourceforge.net/p/simplehtmldom/code/208/tree/trunk/simple_html_dom.php#l76 http://php.net/manual/en/function.file-get-contents.php

于 2013-08-11T17:21:31.967 回答