1

我正在处理一些第 3 方 HTML,它是半结构化的标记文本(粗体、斜体等)。

这是结构的简化示例:

<div>
  <strong class="term">one</strong>
  -
  <b class="defs">
    foo        
    <i class="pos">verb</i>
    bar
    <i class="pos">noun</i>
    baz
    <i class="pos">adjective</i>
    blah
  </b>
  <br>
  <strong class="term">two</strong>
  ... etc ...
</div>

事实上,我已经对其进行了一些处理以使其成为这种形状。我可以处理 HTML 元素,但我无法弄清楚如何处理交错的文本和<i>元素。

我对一个解决方案感到满意,该解决方案要么在<i>s 周围拆分“defs”,一个迭代各个部分的解决方案等。由于特定于浏览器的怪癖,我不希望混合使用 jQuery 和“原始”DOM API 调用,但是我明白如果我不能避免它。从我的浅薄知识看来,jQuery 对标记文本的支持不如对“结构”HTML 的支持...

我错过了一些明显的东西吗?这似乎很难搜索...


事实证明,在现实世界的数据中,文本运行和<i>节点总是交错的,但其中的第一件事defs可能是任何一个,每个文本运行可以包含一个或多个实际文本节点。这意味着<i>s 和 text 运行不是成对的。

好的解决方案可能是为每个文本运行添加标记,或者进行迭代,为每个文本运行做一件事,<i>为每个文本运行做另一件事。我在想jQuery.contents()一些节点类型检查必须是关键......

4

2 回答 2

3

您可以执行以下操作将所有文本检索到数组中

$(function(){
  var json = $('.defs').contents().map(function(){
     var text = $.trim($(this).text()); 
     return  text != "" ? text : null;
  });

  console.log(json);
});​

演示:http: //jsfiddle.net/joycse06/Z5AgL/

上面的代码为您提供了所有的列表defs以及 textnode 和i.

更新

this.nodeName是的,您可以使用 map 函数或在 map 函数内部进行节点类型或名称检查this.nodeTypenodeType因为textnode3。例如在里面添加它.map()并检查

console.log(this.nodeName,this.nodeType);

因此,对于这个特定的标记结构,您可以执行以下操作来检查它是否<i>textnode

if(this.nodeName.toLowerCase() == 'i'){
    console.log('<i>');
    // do stuff for <i> here
}    
else{
    console.log('Text Node');            
    // it's text node
}  

// or with nodeType

if(this.nodeType == 3){
 // textNode
}else{
 // <i> 
}  

演示:http: //jsfiddle.net/joycse06/Z5AgL/6/

于 2012-06-16T16:41:08.850 回答
1

如果您的结构始终如您所见,您可以这样做:

var defs = [];
var def = null;
var tokens = $('.defs').text().split('\n');
for (var i=0; i<tokens.length; i++) {
    if (tokens[i].trim().length>0) {
        if (def==null) {
            def = {name:tokens[i]};
        } else {
            def.value = tokens[i];
            defs.push(def);
            def = null;
        }
    }
};
console.log(defs);

当然,你必须增加保护,或者丰富,这取决于你有什么,但你会得到你可以做的那种操作的精神。

另一种解决方案是让所有部分都用斜体(带有)并在(最后提取的对之后的第$('.pos')一个位置)中寻找它们的第一个位置。$('.defs').text()

于 2012-06-16T16:33:12.333 回答