我正在尝试创建一个脚本,该脚本采用包含多行 YouTube 用户名的 .txt 文件,将其附加到 YouTube 用户主页 URL,然后通过爬网获取配置文件数据。
下面的代码为我提供了一个用户想要的信息,但我不知道从哪里开始导入和迭代多个 URL。
#!/usr/bin/env python
# -- coding: utf-8 --
from bs4 import BeautifulSoup
import re
import urllib2
# download the page
response = urllib2.urlopen("http://youtube.com/user/alxlvt")
html = response.read()
# create a beautiful soup object
soup = BeautifulSoup(html)
# find the profile info & display it
profileinfo = soup.findAll("div", { "class" : "user-profile-item" })
for info in profileinfo:
print info.get_text()
有人有什么建议吗?
例如,如果我有一个 .txt 文件,内容如下:
username1
username2
username3
etc.
我怎样才能遍历这些,将它们附加到http://youtube.com/user/%s并创建一个循环来提取所有信息?