我正在尝试使用 python 和 BeautifulSoup 标记一个 HTML 文件(字面上将字符串包装在“标记”标签中)。问题基本上如下...
假设我有我的原始 html 文档:
test = "<h1>oh hey</h1><div>here is some <b>SILLY</b> text</div>"
我想对此文档中的字符串进行不区分大小写的搜索(忽略 HTML)并将其包装在“标记”标签中。所以假设我想在 html 中找到“这里是一些愚蠢的文本”(忽略粗体标签)。我想采用匹配的 html 并将其包装在“标记”标签中。
例如,如果我想在test中搜索“here is some silly text” ,那么所需的输出是:
"<h1>oh hey</h1><div><mark>here is some <b>SILLY</b> text</mark></div>"
有任何想法吗?如果使用 lxml 或正则表达式更合适,我也愿意接受这些解决方案。