2

我正在尝试从 URL 获取 html 文件的所有CSS文件。

我知道如果我想获得HTML代码,这很容易——只需使用 PHP 函数—— file_get_contents

问题是 - 如果我可以在HTML的 URL 中轻松搜索并从那里获取所有相关CSS文件的文件或内容?

注意- 我想构建一个引擎来获取大量 CSS 文件,这就是为什么仅仅阅读源代码是不够的..

谢谢,

4

2 回答 2

7

您可以尝试使用http://simplehtmldom.sourceforge.net/进行 HTML 解析。

require_once 'SimpleHtmlDom/simple_html_dom.php';

$url = 'www.website-to-scan.com';
$website = file_get_html($url);

// You might need to tweak the selector based on the website you are scanning
// Example: some websites don't set the rel attribute
// others might use less instead of css
//
// Some other options:
// link[href] - Any link with a href attribute (might get favicons and other resources but should catch all the css files)
// link[href="*.css*"] - Might miss files that aren't .css extension but return valid css (e.g.: .less, .php, etc)
// link[type="text/css"] - Might miss stylesheets without this attribute set
foreach ($website->find('link[rel="stylesheet"]') as $stylesheet)
{
    $stylesheet_url = $stylesheet->href;

    // Do something with the URL
}
于 2013-09-11T18:01:24.763 回答
0

您需要解析 HTML 标记以查找 CSS 文件。例如,您可以使用 preg_match - 寻找匹配的正则表达式。

会找到此类文件的正则表达式可能是这样的:

\<link .+href="\..+css.+"\>
于 2013-09-11T18:01:24.443 回答