2

一点背景(我是编程的超级新手,所以请耐心等待):

我正在尝试从谷歌地图中抓取 duration_in_traffic 数字(我知道有一个 API,但这个数据片段仅限于“商业地图”,所以我认为这将是最简单的路线)。

当我使用 Beautiful Soup 查找所有<div>标签时,几乎没有任何东西出现。在仔细检查元素后,看起来页面的大部分都嵌套在一个标签下,如下所示:

<jsl jstcache="79"></jsl>

我假设这与 javascript 和页面的动态特性有关,但是有没有办法使用 Beautiful Soup 访问这个 jsl 标签下的分区?

4

1 回答 1

0

如果 Beautifulsoup 做不到,我可以推荐 lxml.html [0]

[0] http://lxml.de/lxmlhtml.html

于 2015-08-18T00:56:01.040 回答