1

我目前正在尝试提取脚本 type="text/html" 指向的页面。例如,这个 CNN 链接在源代码中有一行:

<script type="text/html" id="pageTemplate"></script>

我想下载 pageTemplate 的内容并能够解析结果。我一直在尝试使用 HTML::TagParser 并且能够获取元素 pageTemplate,但无法获取其内容。

4

1 回答 1

3

照原样,“pageTemplate”没有任何内容。据推测,那是因为它将被用作某些 html 的存储;“text/html”类型的脚本实际上并没有任何事情。即,<script>像这样的一个未显示的 DOM 元素可以用于任何目的。

一种可能性:http ://ejohn.org/blog/javascript-micro-template/

通过与 CNN 页面关联的 javascript 查看有关该 id 用途的线索。

于 2012-04-26T21:23:16.323 回答