我正在尝试使用此正则表达式将标题标签从|title|Page title|
to替换。<title>Page Title</title>
但是作为一个完全的业余爱好者,它并不顺利。
'^|title|^[a-zA-Z0-9_]{1,}|$' => '<title>$1</title>'
我很想知道如何解决它,更重要的是,我做错了什么以及为什么会出错。
你几乎明白了:
您应该将空格字符添加到您的搜索组
$string = '|title|Page title|';
$pattern = '/\|title\|([a-zA-Z0-9_ ]{1,})\|/';
$replacement = '<title>$1</title>';
echo preg_replace($pattern, $replacement, $string); //echoes <title>Page title</title>
查看工作演示
OP 在评论中发布了一些错误的代码,试试这个版本:
$regular_expressions = array( array( '/\|title\|([a-zA-Z0-9_ ]{1,})\|/' , '<title>$1</title>' ));
foreach($regular_expressions as $regexp){
$data = preg_replace($regexp[0], $regexp[1], $data);
}
这是我不久前想出的一个小功能,当用户通过我的服务提交链接时,它基本上可以抓取页面的标题。该函数的作用是获取提供的 URL 的内容。寻找一个标题标签,如果找到,获取标题标签之间的内容并转储它的结果。稍作调整,我相信您可以使用替换方法进行任何操作,并使其满足您的需求。所以这更像是一个起点,而不是一个答案,但总的来说,我希望它在一定程度上有所帮助。
$url = 'http://www.chrishacia.com';
function get_page_title($url){
if( !($data = file_get_contents($url)) ) return false;
if( preg_match("#<title>(.+)<\/title>#iU", $data, $t)) {
return trim($t[1]);
} else {
return false;
}
}
var_dump(get_page_title($url));
<?php
$s = "|title|Page title|";
$s = preg_replace('/^\|title\|([^\|]+)\|/', "<title>$1</title>", $s);
echo $s;
?>