我正在使用DOMDocument和DOMXPath来确定我的 HTML 内容中是否存在某些短语(关键字短语),例如搜索关键字是否为粗体。我使用以下代码并且工作正常,只是在搜索关键字时我需要“忽略”一些字符。使用以下代码:
$characters_to_ignore = array(':','(',')','/');
$keyword = 'keyword AAA';
$content = "Some HTML content for example <b>keyword: AAA</b> and other HTML";
$exp = '//b[contains(., "' . $keyword . '")]|//strong[contains(., "' . $keyword . '")]|//span[contains(@style, "bold") and contains(., "' . $keyword . '")]';
$doc = new DOMDocument();
$doc->loadHTML(strtolower($content));
$xpath = new DOMXPath($doc);
$elements = $xpath->query($exp);
我需要识别“关键字:AAA”以及“关键字 AAA”,因此我需要指定 DOMXPath 查询以在搜索关键字词组时忽略变量 $characters_to_ignore 中的字符。
前面的代码适用于“关键字 AAA”,我怎样才能将其更改为匹配“关键字:AAA”?(以及 $characters_to_ignore 中的任何字符)
新信息:也许使用这个?
fn:包含(字符串 1,字符串 2)
但我找不到一个可行的例子。