8

我需要使用简单的 html dom抓取一个大的 html 文件(例如:http: //www.indianrail.gov.in/mail_express_trn_list.html )。我从一个简单的脚本开始:

<?php
require "simple_html_dom.php";
echo file_get_html('http://www.indianrail.gov.in/mail_express_trn_list.html')->plaintext;
?>

什么都不显示,只是一个空白页面,其中包含 Apache error.log 文件中的错误消息

 PHP Notice:  Trying to get property of non-object in /var/www/index.php on line 3
 PHP Notice:  Trying to get property of non-object in /var/www/index.php on line 3

同时,所有其他页面(例如: http: //www.indianrail.gov.in/special_trn_list.html)都可以使用相同的脚本正常工作。

4

1 回答 1

19

该问题似乎MAX_FILE_SIZEsimple_html_dom.

您可以通过编辑define('MAX_FILE_SIZE', 600000);simple_html_dom.php 文件中的行来调整它。

于 2013-07-30T06:02:27.667 回答