1

我正在尝试将任何页面的源代码加载到仅客户端 html 编辑器的文本框中。我需要能够获取网页的整个来源,而不仅仅是正文。这个 yql 查询只返回正文:

http://query.yahooapis.com/v1/public/yql?format=xml&callback=editor.handleLoad&q=select+*+from+html+where+url%3D%22example.com%22

有没有办法获得整个源代码,或者有没有其他免费的 json-px 网络服务可以?

4

1 回答 1

1

我没有看到使用 YQL 的明显方法,但这里有一个似乎可以工作的 Yahoo Pipe。它拒绝获取其 robots.txt 不允许的站点,但它正在获取其他站点的全部源:

http://pipes.yahoo.com/pipes/pipe.info?_id=dCsGDO123hG6BNv70EypaA

默认设置为 www.example.com,由于该页面上的 robots.txt 而被拒绝。但是,它接受 URL 作为参数。这是此管道的示例用法的链接,该示例获取管道的源代码。yahoo.com 并返回包装在 JSON 中的结果:

http://pipes.yahoo.com/pipes/pipe.run?_id=dCsGDO123hG6BNv70EypaA&_render=json&url=http%3A%2F%2Fpipes.yahoo.com%2F

这有帮助吗?

于 2009-07-22T18:33:59.897 回答