我编写了一个脚本,通过从源磁盘中选择数据并通过按钮提交将数据从 xml 文件导入 mysql 数据库。但是,如果要使用 3rd 方应用程序来自动执行此导入会怎样。检查xml路径的get参数是否存在并获取其内容并以我以前的方式导入是否合适?还是有更好的方法?
通过获取参数我的意思是这样的:
http://domain.com/import.php?path=externaldomain.com/xml/page.xml
我编写了一个脚本,通过从源磁盘中选择数据并通过按钮提交将数据从 xml 文件导入 mysql 数据库。但是,如果要使用 3rd 方应用程序来自动执行此导入会怎样。检查xml路径的get参数是否存在并获取其内容并以我以前的方式导入是否合适?还是有更好的方法?
通过获取参数我的意思是这样的:
http://domain.com/import.php?path=externaldomain.com/xml/page.xml
这取决于您要导入的数据类型。如果您从 rss 提要导入数据,则此方法很好。但是,如果您要导入个人数据,这可能不是一个好方法。
如果您正在处理其他人不应该看到的关键数据,我会建议更安全的东西。您可以开始考虑通过 ftp 导入 xml 文件,从服务器安全文件夹后面下载它们。要求第 3 方应用程序将 xml 文件上传到您选择的安全位置。在某种安全性背后发生的任何事情都比建议的个人数据方法更好。
首先,我建议您使用cURL
. 无论您的 XML 有多大,内存问题都会减少。
$fp = fopen('/var/www/vhosts/my.com/xml/feed.xml', 'w'); // opening file handler to write feed in
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, 'http://domain.com/xml/page.xml'); // setting URL to take XML from
curl_setopt($ch, CURLOPT_ENCODING, 'gzip'); // If result is gziped
curl_setopt($ch, CURLOPT_SSLVERSION, 3); // OpenSSL issue
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, 0); // Wildcard certificate
curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, 2);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 0); // disabling buffer output, bec. we want to write XML to the file first and don't need it to be returned into variable
curl_setopt($ch, CURLOPT_FILE, $fp); // here we should transfer opened file handler to the cURL and it should be writable!
$result = curl_exec($ch); // executing download
$reponse_code = (int)curl_getinfo($ch, CURLINFO_HTTP_CODE); // retrieving HTTP return code for our request. Was it successful or not.
因此,即使 XML 提要在 SSL 和 GZIPed 之后,您也可以直接下载/保存到文件中。
使用curl_getinfo()
您可以获得有关您的请求的各种信息。如果程序应该是自动化的,那么在请求失败时决定做什么会更好。
比,如果文件不大(我的意思是超过 200 - 300 Mb 的非常大的文件),您可以使用SimpleXML
(仅从 PHP5 开始可用)库并解析您的数据。如果您在 PHP4 下(今天仍然可以)尝试找到libXML
也非常有用的。
如果您检索的文件相当大:) 具有FILE
权限的 MySQL 数据库是您的朋友。