1

我正在尝试使用 Beautiful Soup 来隔离特定<table>元素并将其放入新文件中。该表有一个 id,ModelTable我可以使用soup.select("#ModelTable")(“soup”是导入的文件)找到它。

但是,我无法弄清楚如何将元素放入新文件中。简单地将其写入一个新文件(如write(soup.select("#ModelTable"):)是行不通的,因为它不是字符串对象,并将其转换为str()括号中的字符串。

理想情况下,我希望能够在运行隔离元素后导出它,.prettify()这样我就可以立即获得一个好的 HTML 文件。我知道我一定遗漏了一些明显的东西……有什么提示吗?

4

1 回答 1

0

您需要遍历返回对象的内容。您的问题还告诉我 BS4.select使用 CSS 选择器,这太棒了。

with open('file_output.html', 'w') as f:
  for tag in soup.select("#ModelTable"):
    f.write(tag.prettify())
于 2013-11-07T16:23:34.540 回答