所以我正在寻找关于如何最好地复制在 digg 上看到的功能的想法。本质上,您提交您感兴趣页面的 URL,然后挖掘 DOM 以查找所有 IMG 标签(可能只选择一些高于特定高度/宽度的标签),然后从中创建一个缩略图并询问您哪个您想代表您的提交。
虽然那里发生了很多事情,但我主要对从提交页面检索图像的最佳方法感兴趣。
所以我正在寻找关于如何最好地复制在 digg 上看到的功能的想法。本质上,您提交您感兴趣页面的 URL,然后挖掘 DOM 以查找所有 IMG 标签(可能只选择一些高于特定高度/宽度的标签),然后从中创建一个缩略图并询问您哪个您想代表您的提交。
虽然那里发生了很多事情,但我主要对从提交页面检索图像的最佳方法感兴趣。
虽然您可以尝试解析网页 HTML 可能会如此混乱,您最好使用一些接近但不完美的东西。
只需查找并捕获 src="..." 的内容即可。一些基本的操作来处理相对和绝对的图像引用,你就在那里。
显然,当您从第三方按需获取网络资产时,您需要注意不要被滥用。
我建议 cURL + 正则表达式。
您还可以使用PHP Simple HTML DOM Parser,它可以帮助您搜索所有图像标签。