我正在尝试从 HTML 站点中抓取动态信息。由于我工作的地方是银行,我只能使用他们认证为安全的图书馆。Selenium 和 PyQt 不是一个选项,所以我必须使用 wx.html2。
我找到了这个代码片段:
import wx
import wx.html2
class MyBrowser(wx.Dialog):
def __init__(self, *args, **kwds):
url = "http://www.exampleurl.com"
wx.Dialog.__init__(self, *args, **kwds)
sizer = wx.BoxSizer(wx.VERTICAL)
self.browser = wx.html2.WebView.New(self, url=url)
sizer.Add(self.browser, 1, wx.EXPAND, 10)
self.SetSizer(sizer)
self.SetSize((700, 700))
if __name__ == '__main__':
app = wx.App()
dialog = MyBrowser(None, -1)
dialog.Show()
app.MainLoop()
这使我可以打开一个 Web 对话框并查看所需的内容。我想要的是使用 wx.html2.WebView GetPageSource() 方法。
https://wxpython.org/Phoenix/docs/html/wx.html2.WebView.html
我在 MyBrowser 类中尝试过:
class MyBrowser(wx.Dialog):
def __init__(self, *args, **kwds):
url = "http://www.exampleurl.com"
wx.Dialog.__init__(self, *args, **kwds)
sizer = wx.BoxSizer(wx.VERTICAL)
self.browser = wx.html2.WebView.New(self, url=url)
sizer.Add(self.browser, 1, wx.EXPAND, 10)
self.SetSizer(sizer)
self.SetSize((700, 700))
print(wx.html2.WebView.GetPageContent(self.browser))
任何有关如何获取此源 HTML 的想法或对此类的见解将不胜感激。谢谢。