0

我正在使用 PHP Simple DOM 解析器来提取给定页面上的所有图像源,如下所示:

// Include the library
include('simple_html_dom.php');

// Retrieve the DOM from a given URL
$html = file_get_html('http://google.com/');

// Retrieve all images and print their SRCs
foreach($html->find('img') as $e)
    echo $e->src . '<br>';

我希望使用 Wordpress 的管理(后端)区域上的页面,而不是使用 Google.com。这些页面是 PHP 页面,而不是 HTML(但该页面始终具有标准 HTML)。我将如何使用当前页面作为$html变量?PHP新手在这里。

4

1 回答 1

0

使用这里找到的这个库dxtool

登录

require 'WebGet.php';
$w = new WebGet();
// using cache to prevent repetitive download
$w->useCache = true;
$w->cacheLocation = '/tmp';
$w->cacheMaxAge = 3600;
$w->cookieFile = '/tmp/cookie.txt';

// $login_get_data and $login_post_data is associative array
$login = $w->requestContent($login_url, $login_get_data, $login_post_data);

访问包含页面的图像

// $image_page_url is the url of the page where your images exist.
$image_page = $w->requestContent($image_page_url);

解析图像并显示

$dom = new DOMDocument();
$dom->loadHTML($image_page);
$imgs = $dom->getElementsByTagName("img");
foreach($imgs as $img){
    echo $img->getAttribute("src");
}

免责声明:我是这门课的作者

于 2012-12-06T00:55:16.153 回答