0

我有文件websites.txt,这个文件没有排列文本(它是一个源html代码),我想搜索这个源代码并找到与example.com/sub/text匹配的url(所以任何url都以example开头.com/sub/text 应该匹配)并打印/回显它们。

我正在使用 file_get_contents 并且只需要打印与http://www.example.com/sub/text/匹配的内容

我试过 preg_match 但我不知道如何从(http://www.example.com/sub/text/)创建模式

4

2 回答 2

0

检查此以了解目的..在您身边复制和测试..

$contentss = file_get_contents("http://www.ncbi.nlm.nih.gov/pubmed?LinkName=pubmed_pubmed&from_uid=18032633" );

preg_match('/<div class="rprt">(.*)<\/div>/',$contentss,$matches);  
echo $matches[0];
于 2013-06-11T10:09:35.067 回答
0

试试这个:

 $pattern="%http://www.+[a-z]+/+[a-z]+/+[a-z]+/%";

if(preg_match_all($pattern,$content,$match)) {


    print_r($match);


}

pdf->something like this: $pattern="%http://www.+[a-z]+/+[a-z]+/+[a-z]+.pdf%";

于 2013-06-11T10:30:36.620 回答