0

我使用 simplehtmldom_1_5 从网站上抓取了 html 数据,在抓取之后,我想将每个文本插入一个<p>标签中,每个标签的 id 都不同,<p>如下所述:

 Suppose scrapped data:

          <div class="maincontainer">
            <div class="first">
            first text 
            </div>
            <div class="second">
            second text 
            </div>

            <div class="third">
            third text 
            </div>

            <div class="fourth">
            fourth text 
            </div>
fifth string 
          </div>

    And I want result like this below:

          <div class="maincontainer">
            <div class="first">
            <p  id="1">first text </p> 
            </div>
            <div class="second">
            <p  id="2">second text </p>
            </div>

            <div class="third">
            <p  id="3">third text </p>
            </div>

            <div class="fourth">
            <p  id="4">fourth text </p>
            </div>
    <p  id="5">   fifth string </p>
          </div>

伙计们,我想在刮擦期间而不是在刮擦之后这样做。

4

3 回答 3

1

也许不是最有效的方式来工作 jsFiddle

http://jsfiddle.net/Diabl0570/FhZZQ/1/

//jquery
$(function(){
    var count = 1;
    $("div.maincontainer div").each(function(){
           var html = $(this).html(); 
        $(this).html("<span id='"+count+"'>"+ html + "</span>");
        count= count+1;
    });
});
于 2013-04-10T11:38:28.453 回答
0

您可以像这样使用 jQuery:

$(document).ready(function () {
    $('div').each(function (i) {
        var $this = $(this);
        if (!$this.find('div, span, div, img, ul, a').length) {
            var elData = $this.html();
            if ($.trim(elData) != '') {
                var appendData = '<p  id="' + (i + 1) + '">' + elData + '</p>';
                $this.html(appendData);
            }
        }
    });

});

@JsFiddle _

于 2013-04-10T11:37:45.077 回答
0

使用 perl,您可以尝试下面的代码。我将输入文件称为“xml.xml”。我想类似的东西在 php 中起作用,不是吗?

#!/usr/bin/perl

use strict;
use warnings;

open my $fh, "<xml.xml" or die;
my $i;
while (<$fh>) {
    if (/\s*</||/^\s*$/) { print; next }
    ++$i;
    s{^(\s*)(.*)$}{$1<p id="$i">$2</p>};
    redo;
}
close $fh;
于 2013-04-10T11:53:28.203 回答