我正在使用 BeautifulSoup 编写网络解析器。我创建了一个用 生成的行列表bs.findAll(text=True)
,然后逐行拆分并在那里应用我的逻辑。html_payload
是任意网页。
到目前为止我得到的代码是有效的,但它不是很漂亮,这让我觉得必须有一种更好、更优雅的编写方式。
data_to_parse = BeautifulSoup(html_payload)
lines_to_parse = []
d = data_to_parse.findAll(text=True)
for line in d:
for line2 in line.strip().split('\n'):
if line2:
lines_to_parse.append(line2)
for line in lines_to_parse:
pass # here's where I start analyzing results
有没有人可以提出更好的方法来解决这个问题?