我目前正在尝试提取脚本 type="text/html" 指向的页面。例如,这个 CNN 链接在源代码中有一行:
<script type="text/html" id="pageTemplate"></script>
我想下载 pageTemplate 的内容并能够解析结果。我一直在尝试使用 HTML::TagParser 并且能够获取元素 pageTemplate,但无法获取其内容。
我目前正在尝试提取脚本 type="text/html" 指向的页面。例如,这个 CNN 链接在源代码中有一行:
<script type="text/html" id="pageTemplate"></script>
我想下载 pageTemplate 的内容并能够解析结果。我一直在尝试使用 HTML::TagParser 并且能够获取元素 pageTemplate,但无法获取其内容。
照原样,“pageTemplate”没有任何内容。据推测,那是因为它将被用作某些 html 的存储;“text/html”类型的脚本实际上并没有做任何事情。即,<script>
像这样的一个未显示的 DOM 元素可以用于任何目的。
一种可能性:http ://ejohn.org/blog/javascript-micro-template/
通过与 CNN 页面关联的 javascript 查看有关该 id 用途的线索。