4

这是我第一次在这里发帖。我非常感谢有关此主题的任何和所有指导。

我正在尝试制作一个自动填写网络表单并提交数据的程序,将生成的页面返回给程序,以便它可以继续“浏览”页面,允许它递归地提交更多数据。

我遇到的主要问题是:

  • “提交”按钮是用 Javascript 编码的,所以我不知道发出页面请求时表单数据的去向。
  • 我想使用 Excel 表格中的数据填写表格,因此我需要能够从页面外部访问数据。
  • 我需要能够浏览结果页面以继续提交更多数据。

更具体地说,我正在尝试首先登录Practice Mate 网站,导航到“管理患者”,点击“添加患者”,然后填写正确的表格并提交。我正在从数千行长的 Excel 表格中填写表格。
抱歉,如果不提供用户名和密码,我无法更清楚地说明这一点。

我一直在尝试做的是使用 Javascript 从使用 PHP 从 Excel 文档中检索信息的页面发出页面请求。不过,我似乎仍然无法使用这种方法。

我很抱歉在这方面是一个相对新手。提前致谢。

4

2 回答 2

7

您可以使用PHP cURL浏览和提交表单到网站,但这取决于网站的设置方式。大多数都进行了安全检查以防止机器人出现,并且很难让一切正常工作。

我花了一点时间想出了这个登录脚本。如果没有有效的用户名和密码,我无法验证它是否成功,但应该做你需要的。这个简短的示例首先浏览到页面以设置任何 cookie 并抓取提交表单所需的 __VIEWSTATE 值。然后它使用您提供的用户名/密码提交表单。

<?php

// Login information
$username = 'test';
$password = 'mypass';
$utcoffset = '-6';
$cookiefile = '/writable/directory/for/cookies.txt';

$client = new Client($cookiefile);

// Retrieve page first to store cookies 
$page = $client -> get("https://pm.officeally.com/pm/login.aspx");
// scrape __VIEWSTATE value
$start = strpos($page, '__VIEWSTATE" value="') + 20;
$end = strpos($page, '"', $start);
$viewstate = substr($page, $start, $end - $start);

// Do our actual login
$form_data = array(
    '__LASTFOCUS' => '', 
    '__EVENTTARGET' => '',
    '__EVENTARGUMENT' => '',
    '__VIEWSTATE' => $viewstate,
    'hdnUtcOffset' => $utcoffset,
    'Login1$UserName' => $username,
    'Login1$Password' => $password,
    'Login1$LoginButton' => 'Log In'
);
$page = $client -> get("https://pm.officeally.com/pm/login.aspx", $form_data);

// cURL wrapper class    
class Login {
    private $_cookiefile;

    public function __construct($cookiefile) {
        if (!is_writable($cookiefile)) {
            throw new Exception('Cannot write cookiefile: ' . $cookiefile);
        }
        $this -> _cookiefile = $cookiefile;
    }

    public function get($url, $referer = 'http://www.google.com', $data = false) {
        // Setup cURL
        $ch = curl_init();
        curl_setopt($ch, CURLOPT_URL, $url);
        curl_setopt($ch, CURLOPT_REFERER, $referer);
        curl_setopt($ch, CURLOPT_COOKIEFILE, $this -> _cookiefile);
        curl_setopt($ch, CURLOPT_COOKIEJAR, $this -> _cookiefile);
        curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);
        curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
        curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);
        curl_setopt($ch, CURLOPT_AUTOREFERER, true);
        curl_setopt($ch, CURLOPT_MAXREDIRS, 10);

        // Is there data to post
        if (!empty($data)) {
            curl_setopt($ch, CURLOPT_POST, 1);
            curl_setopt($ch, CURLOPT_POSTFIELDS, http_build_query($data));
        }

        return curl_exec($ch);
    }

}
于 2013-01-07T10:29:47.913 回答
0

好吧,我认为 cURL 可以解决问题,curl_init()处理程序很容易解释。仍然在文档阅读的开始,但是,预期会有好的结果。好吧,不太确定结构的 PHP 灵活性,因为这对 cURL 意义重大。希望以后能找到好运。

于 2020-03-15T21:03:28.997 回答