我做了以下函数来解析一个类中的所有子元素:
function getBodyHTML(data){
var elements = "";
var content = $(data).find(".mw-content-ltr").children();
$(content).each(function(i, row){
if($(row).is("h2")){
elements = elements.concat("<h2 class="header2">Header 2 content is: "+($(row).text())+"</h1>");
}else if($(row).is("h1")){
elements = elements.concat("<h1 class="header1">Header 1 content is: "+($(row).text())+"</h1>");
}else if($(row).is("h3")){
elements = elements.concat("<h3>"+($(row).text())+"</h3>");
}else if($(row).is("p")){
elements = elements.concat("<p>"+$(row).text()+"</p>");
}
});
return elements;
}
该函数可以满足我对这种 html 的要求:
<h2 class="main-header">Some Text</h2>
<p>Lorem ipsum dolor sit amet, consectetuer adipiscing elit,
sed diam nonummy nibh. </p>
<p>euismod tincidunt ut laoreet dolore magna aliquam erat
volutpat. Ut wisi enim</p>
<h1>Another text</h1>
<p>euismod tincidunt ut laoreet dolore magna aliquam erat volutpat. Ut wisi enim</p>
但是当 HTML 以这种方式出现时,我无法获得全文:
<h2 class="main-header">Some Text</h2>
Lorem ipsum dolor sit amet, consectetuer adipiscing elit,
sed diam nonummy nibh.
<h1>Another text</h1>
<p>euismod tincidunt ut laoreet dolore magna aliquam erat volutpat. Ut wisi enim</p>
如您所见,h2之后的第一个文本没有任何标记。
我应该在我的函数中添加什么条件来选择那些没有标签的文本?
提前致谢!