3

我是 python 新手,需要一些关于从 HTML 表中提取特定单元格值的指导。

我正在处理的 URL 可以在这里找到

我希望仅在 Month 和 Settlement 列中获取前 5 个值,然后将它们显示为:

"MAR 14:426'6"

我面临的问题是:

  1. 如何让循环从表中的第三个“TR”开始
  2. 如何仅获取 td[0] 和 td[6] 的值。
  3. 如何将循环限制为仅检索 5 行的值

这是我正在处理的代码:

tableData = soup1.find("table", id="DailySettlementTable")
for rows in tableData.findAll('tr'):
    month = rows.find('td')
    print month

谢谢并感谢任何形式的指导!

4

1 回答 1

1

您可能想使用slicing

这是您的代码的修改片段:

table = soup.find('table', id='DailySettlementTable')

# The slice notation below, [2:7], says to take the third (index 2)
# to the eighth (index 7) values from the rows we get.
for rows in table.find_all('tr')[2:7]:
    cells = rows.find_all('td')
    month = cells[0]
    settle = cells[6]

    print month.string + ':' + settle.string
于 2013-12-18T17:33:01.937 回答