我正在寻找这个网站:http ://www.machinerytrader.com/list/list.aspx?ETID=1&catid=1002
我最初尝试使用 PHP 来执行此操作,但发现正文 html 已加密。所以看起来这个 html 最好使用像 phantomjs 这样的无头 webkit 来访问。
我的问题是一个普遍的问题:在 PhantomJS 中抓取这些数据然后将这些数据存储在 MySQL 中的最佳方法是什么?
我没有在网上看到任何这种转变的例子,所以没有什么可做的。
更新:
经过一番阅读,我认为使用 CasperJS 及其下载功能在本地存储原始 html 并稍后使用 PHP 解析它可能是有意义的......但这种方法非常迂回......