您可以查看模拟浏览器(如mechanize)或实际驱动浏览器(如selenium )的东西,它应该报告您在 javascript 运行后看到的 html。
这应该是您需要对 Selenium 执行的操作,但已经有一段时间了:
from selenium import webdriver
br = WebDriver.Ie() #or .Firefox() or .Chrome() (but not on x64)
br.get(r'http://google.com')
html = br.page_source
对于 html 比较,它至少是不同的:
from requests import get
r = get(r'http://google.com')
print r.content[:100]
>>><!doctype html><html itemscope="itemscope" itemtype="http://schema.org/WebPage"><head><meta itemprop'
print html[:100]
>>><html itemtype="http://schema.org/WebPage" itemscope="itemscope"><head><meta http-equiv="X-UA-Compat