我是 Python 新手,我正在尝试使用 BeautifulSoup 解析 HTML 页面并提取一些内容。我遇到的问题是我需要解析的 URL 是动态的,所以我不能像 BeautifulSoup 展示的所有示例一样将它硬编码到 urllib2.urlopen 中。
我试图使用 SELF 从浏览器中提取当前 URL,但我无法让它工作。谁能发布一个示例,说明如何使用 SELF 从浏览器中提取当前 URL,或者如何将 BeautifulSoup 附加到当前 URL?
任何帮助将不胜感激。
到目前为止,这是我的代码:
import os
import time
import win32api
import win32com.client
import win32con
from pywinauto import application
class A(object):
def __init__(self):
self.x = self.request.url
def method_a(self):
print self.x
#start IE with a start URL of what was passed in
app = application.Application()
app.Start(r"c:\program files\internet explorer\iexplore.exe %s"% "http://www.cyclestreets.net/journey")
time.sleep(3)
#ie = app.window_(title_re = "CycleStreets Cycle journey planner")
ie = app.window_(title_re = ".*CycleStreets.*")
a = A()
a.method_a()
当我运行它时,我收到一条消息说 AttributeError: 'A' object has no attribute 'request'