0

我想抓取以下新闻的参与者人数。网址是http://news.sina.com.cn/c/2013-07-11/175827642839.shtml 我想得到820号。它是由javascript生成的。如何使用简单的方式获得该号码?

4

1 回答 1

1

你可以分析javascript代码并在python中做同样的事情。或者你可以在 Python中使用Selenium 。

编辑:

这里来自 selenium 页面的示例已更改为执行您需要的操作。

它打开浏览器(firefox),等待 5 秒(加载页面)并获取文本

#!/usr/bin/python

import selenium
from selenium import webdriver
from selenium.common.exceptions import NoSuchElementException
from selenium.webdriver.common.keys import Keys
import time

browser = webdriver.Firefox() # Get local session of firefox
browser.get("http://news.sina.com.cn/c/2013-07-11/175827642839.shtml ") # Load page
time.sleep(5) # Let the page load
try:
    element = browser.find_element_by_xpath("//span[contains(@class,'f_red')]") # get element on page
    print element.text # get element text
except NoSuchElementException:
    assert 0, "can't find f_red"
browser.close()
于 2013-07-14T01:02:19.897 回答