我有一个可以抓取https://performance.morningstar.com/fund/tax-analysis.action?t=AGRYX®ion=usa&culture=en-US的 python 程序。它大部分时间都有效,但可能有大约 1/3 的时间我的代码执行没有通过
driver.get('https://performance.morningstar.com/fund/tax-analysis.action?t=' + ws.cell(i,2).value + '®ion=usa&culture=en-US')
wherews.cell(i,2).value
只是 Excel 电子表格中的股票代码。
没有错误被抛出。它根本没有通过这条线。浏览器完全加载我想要的页面,它只是没有进一步(再次,没有抛出错误)。
我添加了这些选项,希望获得最好的
options = webdriver.ChromeOptions()
options.add_argument('--disable-software-rasterizer')
options.add_argument('--ignore-certificate-errors')
options.add_argument('--ignore-ssl-errors')
options.add_argument('--ignore-certificate-errors-spki-list')
options.add_argument('--disable-gpu')
options.add_argument('--allow-running-insecure-content')
driver=webdriver.Chrome(r"C:\path\to\my\chromedriver\chromedriver.exe", chrome_options=options)
我不知道这是否重要,但我确实在地址栏中看到了一条警告,上面写着该网站“!不安全”,这对我来说似乎很奇怪,因为尽管 Morningstar 会竭尽全力确保它们提供安全的内容。为了好玩,我确实将我的 chrome 选项设置为接受该网站的不安全内容,但这并没有什么不同。
我怎样才能在这条线之外继续我的代码执行?这个问题与我的类似,但由于没有抛出错误,所以给出的答案对我不起作用。