我不久前发布了这个问题,它非常适合从用户生成的帖子中查找和“链接”链接。 Linkify 正则表达式函数 PHP 大胆火球法
<?php
if (!function_exists("html")) {
function html($string){
return htmlspecialchars($string, ENT_QUOTES, 'UTF-8');
}
}
if ( false === function_exists('linkify') ):
function linkify($str) {
$pattern = '(?xi)\b((?:(http)s?://|www\d{0,3}[.]|[a-z0-9.\-]+[.][a-z]{2,4}/)(?:[^\s()<>]+|\(([^\s()<>]+|(\([^\s()<>]+\)))*\))+(?:\(([^\s()<>]+|(\([^\s()<>]+\)))*\)|[^\s`!()\[\]{};:\'".,<>?«»“”‘’]))';
return preg_replace_callback("#$pattern#i", function($matches) {
$input = $matches[0];
$url = $matches[2] == 'http' ? $input : "http://$input";
return '<a href="' . $url . '" rel="nofollow" target="_blank">' . "$input</a>";
}, $str);
}
endif;
echo "<div>" . linkify(html($row_rsgetpost['userinput'])) . "</div>";
?>
我担心我可能会通过将用户生成的内容插入链接来引入安全风险。htmlspecialchars($string, ENT_QUOTES, 'UTF-8')
在通过 linkify 函数运行它并回显到页面之前,我已经在转义来自我的数据库的用户内容,但是我在 OWASP 上读到需要对链接属性进行特殊处理以缓解 XSS。我认为这个功能没问题,因为它将用户生成的内容放在双引号内并且已经用 转义了htmlspecialchars($string, ENT_QUOTES, 'UTF-8')
,但非常感谢具有 xss 专业知识的人来确认这一点。谢谢!