我正在尝试按照标准将丰富的代码段数据应用于我的网页http://schema.org/Article
。其中一个属性是articleBody
,我希望它应该包括构成文章的整个正文。
不幸的是,文章的 HTML 表示偶尔会出现按钮、广告和其他提示,其中包含不应进入articleBody
.
例如:
<div itemscope itemtype="http://schema.org/Article">
<div itemtype="articleBody">
<p>1st Paragraph</p>
<p>2nd paragraph</p>
<a>A few useful links for my users</a>
<p>3rd paragraph</p>
<div>A few text ads</div>
<p>4th paragraph</p>
</div>
</div>
有没有办法从文章本身中排除广告/链接中的文字?