4

我需要解析 html 表格来执行诸如获取某个单元格的上方/下方或左/右列中的所有单元格之类的事情。有没有可以轻松做到这一点的python库?

4

4 回答 4

2

美丽汤

于 2012-04-26T14:13:03.823 回答
1

您可以使用lxml(带有 Python 的 XML 和 HTML)来解析表格。是一个简单的示例,说明您可以对表执行哪些操作(加载和遍历行)。

于 2012-04-26T14:16:58.723 回答
0

看看pyquery。它允许对 xml 文档进行 jquery 查询。快速浏览API似乎 prevAll 和 nextAll 可以找到左/右单元格。认为获得上面/下面的也不会那么困难。

于 2012-04-26T14:22:47.217 回答
0

此代码将页面中的所有表格转换为列表。

import pandas as pd
url = r'https://en.wikipedia.org/wiki/List_of_S%26P_500_companies'
tables = pd.read_html(url) # Returns list of all tables on page
sp500_table = tables[0] # Select table of interest
于 2019-03-07T22:10:56.737 回答