我正在尝试使用 Java (JSoup) 来抓取 ESPN 梦幻棒球队页面,以获取花名册信息,以创建基础 ESPN 联盟无法支持的更强大的交易应用程序。我希望能够获得要包含在我的应用程序中的播放器照片 URL,但我无法轻松导航到包含此信息的页面/div。这是我迄今为止发现的。
面糊表
表格包含具有以下格式锚标记的玩家列表...
<a href="" class="flexpop" content="tabs#ppc" instance="_ppc" fpopheight="357px" fpopwidth="490px" tab="null" leagueid="00000" playerid="3452" teamid="6" seasonid="2016" cache="true">Eric Hosmer</a>
注意:我在上面的示例中更改了我的 Leagueid
播放器 FlexPop
When the anchor tag is selected a new div is dynamically added to the page which contains the image link I am looking for. 下面是包含我要查找的信息的 div 部分。
<img width="200" height="145" src="http://a.espncdn.com/combiner/i?img=/i/headshots/mlb/players/full/30993.png&w=200&h=145" border="0" alt="Eric Hosmer" onerror="this.src='http://g.espncdn.com/s/flblm/14//images/playerpop/design2/no-mugshot-7.png'">
您可以在源链接中看到图像链接 [ 30993 ] 中的 playerId 与上方锚标记 [ 3452 ]中的 playerId 不匹配。
有谁知道我的幻想联盟中的 playerId 与整体 ESPN playerId 之间是否存在任何联系/相关性?我想尝试在不使用测试网络浏览器自动化器(例如 Selenium、HtmlUnit)的情况下解决这个问题。