您可以使用lxml(带有 Python 的 XML 和 HTML)来解析表格。这是一个简单的示例,说明您可以对表执行哪些操作(加载和遍历行)。
于 2012-04-26T14:16:58.723 回答
This answer is useful
0
看看pyquery。它允许对 xml 文档进行 jquery 查询。快速浏览API似乎 prevAll 和 nextAll 可以找到左/右单元格。认为获得上面/下面的也不会那么困难。
于 2012-04-26T14:22:47.217 回答
This answer is useful
0
此代码将页面中的所有表格转换为列表。
import pandas as pd
url = r'https://en.wikipedia.org/wiki/List_of_S%26P_500_companies'
tables = pd.read_html(url) # Returns list of all tables on page
sp500_table = tables[0] # Select table of interest