2

我在标记中有这样的数据:

  <p class="bbook">Lorem</p>
  <p class="bref">
     <a class="ref" href="prin.v.ii.ii.html">2:15</a>
     <a class="ref" href="prin.v.i.v.html">3:17-19</a>
     <a class="ref" href="prin.v.v.html">3:19 </a>
  </p>

 <p class="bbook">Ipsum</p>
 <p class="bref">
     <a class="ref" href="sec.vii.xxii.html">10:18</a>
     <a class="ref" href="sec.vii.ix.html">10:27</a>
     <a class="ref" href="sec.vii.xxiii.html">10:28</a>
 </p>

我想将它转换为这样的 JSON 对象:

{
    "Lorem": {
        "prin.v.ii.ii.html": "2:15",
        "prin.v.i.v.html": "3:17-19",
        "prin.v.v.html": "3:19"
    },
    "Ipsum": {
        "sec.vii.xxii.html": "10:18",
        "sec.vii.ix.html": "10:27",
        "sec.vii.xxiii.html": "10:28"
    }
}

我在这里看到了一些从 HTML 到 JSON 的解决方案,但我找不到与属性相关的解决方案。我知道如果标记有ul's 但它没有可能会更容易。我怎么能转换这个?

4

5 回答 5

4

很容易,我应该想。以下是 jQuery 风格的 Javascript 中的一些示例代码,但您可以调整以使用您选择的语言中的 DOM 遍历器和 JSON 库。(例如,在 Perl 中,您将使用 HTML::TreeBuilder 和 JSON 模块。)

var json_obj = {};
$('p.bbook').each(function(i,el) {
    var which = $(el).text();
    var refs = {};
    $(el).next('p.bref').find('a.ref').each(function(i,el) {
        var href = $(el).attr('href');
        var chapter_verse = $(el).text();
        refs[href] = chapter_verse;
    });
    json_obj[which] = refs;
});
var json_result = JSON.stringify(json_obj);

此时,json_result包含一个 JSON 字符串,其内容与您在问题中描述的内容相匹配。

于 2013-07-18T16:22:10.517 回答
2

使用 jQuery 框架中的 $.parseJSON() 和 $.each()。这里有一个例子:

$(document).ready(function () {
    var jsonp = '[{"Lang":"jQuery","ID":"1"},{"Lang":"C#","ID":"2"}]';
    var lang = '';
    var obj = $.parseJSON(jsonp);
    $.each(obj, function () {
        lang += this['Lang'] + "<br/>";
    });
    $('span').html(lang);
});​

​</p>

于 2013-07-18T16:20:37.670 回答
1

我认为你应该看看Beautiful Soup 4

启动一个 Python 脚本,将 html 提供给汤,你应该能够将任何你想要的东西放入字典中,并在最后使用 json.dumps() 来获取你的 JSON。

# import/install bs4, json (already included)
end_json = {}

soup = BeautifulSoup(html_string)
books = soup.findAll('p', class='bbook')
for book in books:
    # etc, etc

编辑:不知道我怎么错过了问题标题中的 JQuery,但是 BS4 很棒。

于 2013-07-18T16:22:08.347 回答
1

jsFiddle

$(document).ready(function() {
    var O = {}, el, key, a;
    $('.bbook').each(function(index, value) {
        el = $(value);
        key = el.text();
        O[key] = {};
        el.next().find('a').each(function(i, v) {
            a = $(v);
            O[key][a.attr('href')] = a.text();
        });
    });

    console.log(JSON.stringify(O));
});
于 2013-07-18T16:37:57.470 回答
1

http://jsfiddle.net/wDjhJ/

var result = {};
$('.bbook').each(function(a,b){
    var $this = $(b);
    result[$this.text()] = {};
    $this.next().find('a').each(function(k,v){
        var item = $(v);
        result[$this.text()][item.attr('href')] = item.text();
    });
});

$('body').append(JSON.stringify(result));

用几个循环遍历 dom。

于 2013-07-18T16:28:47.950 回答