1

我想使用 BeautifulSoup 解析以下 HTML:

<tr class="TrGameOdd">
  <td align="center">
    <a href="Schedule.aspx?WT=0&amp;lg=778&amp;id=,1583114">
      <img border="0" src="/core/engine/App_Themes/Global/images/plus.gif">
    </a>
  </td>
  <td align="left">Oct 20</td>
  <td>777</td>
  <td align="left" colspan="2">Cupcakes</td>
  <td align="right">7+3
    <input type="checkbox" value="0_1583114_-3440" name="text_">
  </td>
  <td align="right">a199
    <input type="checkbox" value="2_1583114_-199.5_-110" name="text_">
  </td>
</tr>

有一大堆这样的行,但我只需要其中的细节。例如,我想解析777, Cupcakes, 7+3, -3440, a199出所有这些。我该怎么做呢?我希望它并排打印,并且我想要解析其中的一些行,所以当它打印时应该是这样的:

777 Cupcakes 7+3 -3440
X X X X
X X X X
etc
4

1 回答 1

2
from BeautifulSoup import BeautifulSoup
soup = BeautifulSoup(html)
trs = soup.find("tr",{"class":"TrGameOdd"})

for tr in trs:
   tds = tr.findAll("td")

   print tds[1].string # Oct 20
   print tds[2].string # 777
   print tds[3].string # Cupcakes
   ...      

你需要继续自己 http://www.crummy.com/software/BeautifulSoup/bs4/doc/

于 2012-12-20T17:15:10.723 回答