3

所以我试图在一个抓取的 html 文件中找到一个蒸汽 ID 的列表。这是我到目前为止所拥有的,但它不起作用,它正在解析一个我保存为文本的 html 页面,并且应该输出带有以下变量的内容,它正在输出一个空白页面。

   <?php
$filein = file('TF2U.txt');
foreach ($filein as $html) {
    $pattern = '#.*<a[^>]+href="steamcommunity.com/profiles/([0-9]+)/"#iA';
    $matches = NULL;
    $match_count = preg_match_all($pattern, $html, $matches);
    if ($match_count > 0) {
        echo implode($matches[1]);
        echo "<br>\n";
        }
}
?>

任何帮助都会很棒,我不确定我错过了什么,但这可能很简单。

4

1 回答 1

2

问题是链接不以 a 结尾/,所以这里有一些调整的解决方案:

$file = file_get_contents('TF2U.htm');
preg_match_all('#<a.*?href="(?:http://)steamcommunity.com/profiles/(?P<id>\d+)[^‌​&gt;]+#msi', $file, $matches);
print_r($matches['id']);
于 2013-04-20T22:44:13.843 回答