我正在使用以下脚本来抓取信息以创建邮政邮寄标签。
该脚本从ul
我的县公共税收数据库的类“描述关键字”标签中抓取所有数据。
我的问题是如何只抓取类“描述键”的前 3 个li
元素。ul
请记住,此类在 html 中使用了 100 多次,我只需要包含邮寄地址信息的前 3 个元素。
我需要添加什么才能仅获取li
我需要的元素?
该脚本运行良好,但它获取了太多信息。
谢谢
以下代码行获取了我需要的所有数据,但还提供了 2 个我不需要的额外li
元素。
a = soup.findAll(attrs={"class" : "description keywords"})
我只需要收集类的前3个li
元素- ul
“描述关键字”