是否可以使用 PHP cURL、HTML DOM 解析器或任何其他方法提取远程 HTML 页面的一部分,并将其打印到另一个页面上,保留原始格式样式、图像、选项卡功能?例如,如何从http://ru.yahoo.com/提取中心列的内容(带有制表符和格式,保留原始文本的外观) ?
据我了解,脚本应该处理外部 CSS,以便返回的内容与原始内容具有相同的外观。如果可能的话,什么是最合适的方式?如果是的话,一个例子将不胜感激。我查看了几个示例,但没有找到适合我的案例的任何解决方案。
是否可以使用 PHP cURL、HTML DOM 解析器或任何其他方法提取远程 HTML 页面的一部分,并将其打印到另一个页面上,保留原始格式样式、图像、选项卡功能?例如,如何从http://ru.yahoo.com/提取中心列的内容(带有制表符和格式,保留原始文本的外观) ?
据我了解,脚本应该处理外部 CSS,以便返回的内容与原始内容具有相同的外观。如果可能的话,什么是最合适的方式?如果是的话,一个例子将不胜感激。我查看了几个示例,但没有找到适合我的案例的任何解决方案。
好吧,如果我必须快速完成(阅读:非常脏),我会这样做,我认为:
小提琴直到它看起来足够好。但是:我认为由于相同的域策略,这会破坏外部 JS 文件的加载。
一个不错的方法是:
您知道:RSS 就是为此而发明的,如果他们不提供 RSS 提要,他们很可能不希望您获取内容并将其发布在您自己的网站上。:P