0

大家下午好,首先我希望这是问这个问题的正确地方。我担心这个问题可能会被关闭,因为它在错误的地方,但我认为它适合这里,所以这里......

我想从网页中抓取信息并将其显示在 Android 上的小部件中。我想从一个名为“blogbody”的类中抓取信息,但这个类在网页中出现了多次。我需要的信息在“blogbody”的第三个实例中,我怎样才能正确地抓取这些信息?

以下是来自网站 (www.crossfit.com) 的示例。

<td width="440" rowspan="2" align="left" valign="top" bgcolor="#FFFFCC" border="0" cellspacing="2" cellpadding="0">
<table width="440" border="0" cellspacing="0" cellpadding="2">
  <tr>
    <td align="left" valign="top">      
    <div class="date">  August 17, 2012 </div>      
    <div class="blogbody">      
    <a name="8553"></a>
    <h3 class="title">Friday 120817</h3>
    <p>Snatch balance 1-1-1-1-1-1-1</p>
    <p>Post loads to comments.</p>
4

1 回答 1

1

您可以为此使用一个好的 HTML 解析器,我推荐JSoup,如果您将来的需求发生变化,它非常快速且非常灵活,使用起来也非常简单。您将能够在堆栈溢出本身中找到许多有用的问题。

我希望它有所帮助。

于 2012-08-22T04:07:29.490 回答