我从这个页面得到第二个表,解析它并尝试从这些数据中生成散列。问题是每个对象都被这个灰色分隔,TR
但我只能通过TR
从这个表中获取每个对象来管理它。
我如何TR
通过在灰色之间确定正确的?
现在我正在使用这条线来获取每个TR
:
parsed_html.css("table")[1].css("tr")
编辑:
我不知道哈希是否是完成这项任务的好方法,但这里是“起重和支撑”部分的 JSON(这是示例之一,请随时纠正我):
{
"chapter":"07",
"title":"LIFTING AND SHORING",
"description":"This chapter shall...",
"section":[
{
"number":"00",
"title":"GENERAL",
"description":"",
},
{
"number":"10",
"title":"JACKING",
"description":"Provides information relative...",
},
{
"number":"20",
"title":"SHORING",
"description":"Those instructions necessary...",
}
]
}