我想在文本中找到任何具有最小长度(eq 4)的单词,它也可以在诸如<strong>
或<h1>
等标签之间。之后我想对这些单词进行某种加权。正常单词只是变得比 a 之间的单词低<strong>
。但是这些词不应该单独出现在得分更高的标签中(比如强)。
示例内容
Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor
invidunt ut labore et dolore <strong>magna aliquyam erat</strong>, sed diam voluptua.
Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor
invidunt ut labore et dolore <strong>magna</strong> aliquyam erat, sed diam voluptua
我可以使用正则表达式来执行此操作,例如查找任何单词并在 preg 回调中检查它们是否在标签内,或者这怎么可能?
多谢!