我正在尝试解决 Drupal 的 Hashtags 模块中的这个错误:http: //drupal.org/node/1718154
我有这个函数可以匹配文本中以“#”为前缀的每个单词,例如#tag:
function hashtags_get_tags($text) {
$tags_list = array();
$pattern = "/#[0-9A-Za-z_]+/";
preg_match_all($pattern, $text, $tags_list);
$result = implode(',', $tags_list[0]);
return $result;
}
我需要忽略页面中的内部链接,例如<a href="#reference">link</a>
,或者更一般地说,任何以 # 为前缀的出现在 HTML 标记内的单词(所以前面是 <,后面是 >)。
知道如何实现这一目标吗?