Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
基本上,我正在构建一个网站,该网站进行网络抓取并从大约 8 个不同的网站获取特定网页以提取价格。我正在广泛使用 file_get_html()函数PHP Simple HTML DOM Parser将页面源获取到字符串变量中并从中提取价格信息。
file_get_html()
PHP Simple HTML DOM Parser
现在的主要问题是显示来自所有不同站点的价格信息的页面需要很长时间才能加载。
所以我的问题是
不要在页面加载时获取数据,而是在后台作业(cronjob?)中进行并将其保存在数据库中。
因此,您只需从数据库中检索数据。此外,您可以在检索数据时添加带有时间戳的文本和/或让用户能够手动更新(获取)数据。
好吧,首先你们可以使用 cURL 代替file_get_html(),它很容易且非常可配置 + 它比使用简单的 html dom 函数更快。显然,之后您必须使用简单的 html dom 函数将字符串转换为 dom 对象str_get_html()。
str_get_html()