我想抓取以下新闻的参与者人数。网址是http://news.sina.com.cn/c/2013-07-11/175827642839.shtml 我想得到820号。它是由javascript生成的。如何使用简单的方式获得该号码?
问问题
582 次
1 回答
1
你可以分析javascript代码并在python中做同样的事情。或者你可以在 Python中使用Selenium 。
编辑:
这里来自 selenium 页面的示例已更改为执行您需要的操作。
它打开浏览器(firefox),等待 5 秒(加载页面)并获取文本
#!/usr/bin/python
import selenium
from selenium import webdriver
from selenium.common.exceptions import NoSuchElementException
from selenium.webdriver.common.keys import Keys
import time
browser = webdriver.Firefox() # Get local session of firefox
browser.get("http://news.sina.com.cn/c/2013-07-11/175827642839.shtml ") # Load page
time.sleep(5) # Let the page load
try:
element = browser.find_element_by_xpath("//span[contains(@class,'f_red')]") # get element on page
print element.text # get element text
except NoSuchElementException:
assert 0, "can't find f_red"
browser.close()
于 2013-07-14T01:02:19.897 回答