1

我正在尝试编写一些代码来自动填写此网络表单:

http://scoweb.sco.ca.gov/UCP/

然后读取返回的结果。当我有 UCP 时,我会查找我的姓名并通知自己。

我曾尝试用 C#(System.Net)、curl(结合 formfind)、Ruby(Mechanize)和 Python(Scrapy,urllib2)编写程序。我的所有脚本都适用于与数据库通信的常规 HTML 表单,但这个脚本什么也不返回。

我的理论是因为该站点使用 ASP,而我没有采取任何措施来解决这个问题?

任何工作代码,尽管首选 python,填写表格并返回结果将不胜感激。

4

2 回答 2

0

我认为问题是因为表单使用了 javascript。你可以使用 selenium 来做这样的事情http://seleniumhq.org/

于 2012-10-26T22:28:16.887 回答
0
#!/usr/bin/env python

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import Select
from selenium.common.exceptions import NoSuchElementException
import unittest, time, re

class Shiply(unittest.TestCase):
    def setUp(self):
        self.driver = webdriver.Firefox()
        self.driver.implicitly_wait(30)
        self.base_url = "http://scoweb.sco.ca.gov/"  #California UCP
        self.verificationErrors = []

    def test_shiply(self):
        driver = self.driver
        driver.get(self.base_url + "/UCP/")
        driver.find_element_by_id("ctl00_ContentPlaceHolder1_txtLastName").clear()
        driver.find_element_by_id("ctl00_ContentPlaceHolder1_txtLastName").send_keys("YOUR_NAME")
        driver.find_element_by_id("ctl00_ContentPlaceHolder1_btnSearch").click()

    def is_element_present(self, how, what):
        try: self.driver.find_element(by=how, value=what)
        except NoSuchElementException, e: return False
        return True

    def tearDown(self):
        self.driver.quit()
        self.assertEqual([], self.verificationErrors)

if __name__ == "__main__":
    unittest.main()
于 2012-10-27T10:45:31.947 回答