我正在构建一个使用 XPath 分析 HTML 的命令行 php 抓取应用程序 - 问题是每次在循环中加载一个新的 DOMXPath 类实例时,我都会遇到大约等于正在加载的 XML 大小的内存损失. 该脚本运行并运行,慢慢地建立内存使用量,直到达到限制并退出。
我尝试过强制垃圾收集,gc_collect_cycles()
但 PHP 仍然没有从旧的 Xpath 请求中取回内存。确实 DOMXPath 类的定义似乎没有包含析构函数?
DOMXPath
所以我的问题是......在我已经提取了必要的数据之后,有没有办法强制清理垃圾?在类实例上使用 unset 可以预见地没有任何作用。
代码没什么特别的,只是标准的 Xpath 东西:
//Loaded outside of loop
$this->dom = new DOMDocument();
//Inside Loop
$this->dom->loadHTML($output);
$xpath = new DOMXPath($this->dom);
$nodes = $xpath->query("//span[@class='ckass']");
//unset($this->dom) and unset($xpath) doesn't seem to have any effect
正如您在上面看到的,我将一个新DOMDocument
类的实例化保留在循环之外,尽管这似乎并没有提高性能。我什至尝试将$xpath
类实例从循环中取出并直接使用该方法将 DOM 加载到 Xpath 中__constructor
,内存损失是相同的。