0

我想从网站获取内容,但是当我使用 file_get_contents() 函数时,我得到了 HTML 代码,但其中一些丢失了,我检查了网站代码,我知道有些部分是由 Ajax 生成的,我不知道如何得到他们,有人有什么建议吗?我可能会得到一些示例,站点:http ://www.drbattery.com/category/notebook+battery/acer/aspire+series.aspx?p= 3 请求:我想获取此页面上列出的那些笔记本电脑型号,例如“Aspire 1690”等。我需要所有这些模型。

4

1 回答 1

0

嗯。

在 JS 中,您可以通过以下方式在浏览器中访问 HTML 内容

document.getElementsByTagName('body')[0].innerHTML

做这个服务器端,你可能需要一个无头浏览器。当内容完成加载并且一切就绪时,棘手的部分将是检测。(您将无法通过 跟踪 AJAX 请求"window.onload"。)

手动操作,您可以在浏览器中添加书签,例如

javascript:alert(document.getElementsByTagName('body')[0].innerHTML)

然后,您可以通过键盘快捷键(CTRL + A 或 Command + A)选择警报的内容,复制它,然后按回车键(因为对话框的关闭按钮可能会看不见)。

于 2013-09-25T03:53:35.930 回答