2

我想使用 Python 将网页的文本内容保存到 Excel 文件中。作为一个新手,到目前为止我可以锻炼,但我不确定它是否正确。

from bs4 import BeautifulSoup
from urllib2 import urlopen

html = urlopen("http://www.chicagoreader.com").read()
soup = BeautifulSoup(html, "lxml")

它看起来好吗?自动将文本内容保存到 Excel 文件中的下一步是什么?我已经安装了 xlutils 但不知道如何使用它。

有人可以在这里帮助我吗?谢谢。

4

1 回答 1

2

为了使用 python 写入 excel 文件,您有几个包可供选择:

所以,这取决于它应该是什么类型的 excel 文件,xls或者xlsx,你是否需要格式化,速度是否重要等。

这是一个关于如何将网页标题写入 (0,0) 单元格的示例xlwt

import xlwt  
from bs4 import BeautifulSoup
from urllib2 import urlopen

html = urlopen("http://www.chicagoreader.com").read()
soup = BeautifulSoup(html, "lxml")

workbook = xlwt.Workbook()
sheet = workbook.add_sheet('test')

sheet.write(0, 0, soup.title.text)

workbook.save('output.xls')

希望有帮助。

于 2013-06-07T10:50:05.737 回答