我想从http://www.youtube-mp3.org/下载几首歌曲。我正在使用 urllib2 和BeautifulSoup。
问题是,当我 urllib2 打开带有插入视频 ID 的站点http://www.youtube-mp3.org/?c#v=lV7r8PiuecQ时,我得到了该站点,但他们对此很棘手并加载了信息在带有一些 js ajax 内容的初始页面加载之后。因此,当我尝试抓取下载链接的 url 时,它实际上不在页面上,因为它尚未加载。
任何人都知道我如何在我的 python 脚本中触发这个 js 加载器,或者什么?
这是在将我想要的内容加载到其中之前的相关空 html。
<div id="link_box" style="display:none">
<div id="link_box_title" style="font-weight:bold; text-decoration:underline">
</div>
<div class="row">
<div id="link_box_bb_code_title" style="font-weight:bold">
</div>
<input type="text" id="BBCodeLink" onclick="sAll(this)" />
</div>
<div class="row">
<div id="link_box_html_code_title" style="font-weight:bold">
</div>
<input type="text" id="HTMLLink" onclick="sAll(this)" />
</div>
<div class="row">
<div id="link_box_direct_code_title" style="font-weight:bold">
</div>
<input type="text" id="DirectLink" onclick="sAll(this)" />
</div>
</div>
<div id="v-ads">
</div>
<div id="dl_link">
</div>
<div id="progress">
</div>
<div id="loader">
<img src="ajax-loader-b.gif" alt="loading.." width="16" height="11" />
</div>
</div>
<div class="clear">
</div>
</div>