我将 200 个网址放在一个名为 url.txt 的文本文件中,如下所示:
url_1
url_2
url_3
....
url_n
我想在 python 中遍历所有这些以获取每个 url 页面的内容(文本)。浏览此文本文件中的每个 url 的最简单方法是什么?刮痧?或者只是写另一个脚本?
import urllib
from bs4 import BeautifulSoup as BS
html =urllib.urlopen('url').read()
soup = BS(html)
print soup.find('div',{'class':'drkgry'})[1].get_text()