0

我正在使用 Perl 处理网页IO::Allio($url)功能。

我正在处理的页面表面上具有格式良好的 URL。例如

http://www.forbes.com/billionaires/list/#page:15_sort:0_direction:asc_search:_filter:All%20industries_filter:All%20countries_filter:All%20states

注意#page:15_

当我查看源或打印出源返回 fromm 时io(),我看到出现在网站第 1 页上的名称,例如,

<!-- Start: list_row -->
<tr>
  <td class="rank">1</td>
  <td class="company">
    <a href="/profile/carlos-slim-helu/">
      <img src="http://i.forbesimg.com/media/lists/people/carlos-slim-helu_50x50.jpg" alt="">
      <h3>Carlos Slim Helu & family</h3>
    </a>
  </td>
  <td class="worth">$73 B</td>
  <td>73</td>
  <td>telecom</td>
  <td>Mexico</td>
</tr>

但是,如果我在浏览器的开发人员工具中打开页面并查看对象模型,我会在列表中看到我希望在第 15 页上看到的人的条目,例如,

<TR>
  <TD class=rank>1342</TD>
  <TD class=company><A href="/profile/park-hyeon-joo/">
    <IMG alt="" src="http://i.forbesimg.com/media/lists/people/park-hyeon-joo_50x50.jpg"> 
    <H3>Park Hyeon-Joo</H3></A>
  </TD>
  <TD class=worth>$1 B</TD>
  <TD>54</TD>
  <TD>Mirae</TD>
  <TD>South Korea</TD>
</TR>

我可以让 Perl 打开页面给我正确的内容吗?

4

1 回答 1

0

我做了一点点四处逛逛。表的数据实际上是从这个 url 加载的:http://www.forbes.com/ajax/load_list/?type=person&uri=billionaires&year=2013

根据您实际尝试完成的任务,获取并解析它可能更容易(它是 JSON 格式的)。

于 2013-04-24T17:53:36.907 回答